전체 글 110

[LabSeminar] RigNet : Neural Rigging for Articulated Charaters

논문 원본 projectPage 1. Introduction Animation가능한 Avatar에는 3가지 요소가 필요함. 3차원 모델의 표면을 표현해줄 3Dmesh 움직임을 만들어줄 뼈대 (rig) mesh가 뼈대를 따라 어느부위가 얼만큼 움직일지에 대한 정보 (skin weights) RigNet은 3D매쉬(.obj)를 Rigged model(.fbx)를 만들어주는 네트워크임 2. Method Joints를 얻고 Bones를 얻고 Skining Weights를 얻음 1. Get joints GMEdgeNet을 이용하여 3D메쉬의 버텍스들이 관절이 있을 법한 곳으로 옮김. GMEdgeNet을 이용하여 3D메쉬의 버텍스들중 관절이 있을 법한 곳을 attention함 두 정보를 이용하여 clustering..

[강화학습] 2주차 3강 ~ 4강

혁펜하임님의 트이는 강화학습을 보고 학습 중 입니다. Optimal Policy State Value function을 Maximize하는 policy $ V(s_t) \triangleq \int G_t P(a_t...a_{\infty})da_t:a_{\infty}$을 최대화하는 $P(a_t,s_t)$. $= \int Q(s_t,a_t)p(a_t|s_t)da_t$ 현재의 optimal policy를 구하는 게 목적, 미래의 optimal policy가 주어져 있다고 가정. $ P^*(a_t|s_t) = \underset{p(a_{t+1}|s_{t+1})}{argmax} \int Q^*(s_t,a_t)da_t $ $ P^* $ : 현재 상태에서의 optimal policy 즉, 미래의 Q를 최대화하는 ac..

[view synthesis] Stereo Magnification : Learning view synthesis using multiplane images 정리

논문 원본 깃허브 홈페이지 용어 / 배경 지식 RGBA : RGB각각 3채널에 투명도를 나타내는 알파채널을 포함 Muliplane image : 2디 사진을 여러장을 겹쳐 입체적으로 보이게 한 image Plane Sweep Task 실제 카메라에 담기지 않은 시점의 view를 합성해내는 것 3D reconstruction : NeRV NerF Multiplane image : stereo Magnification, LLFF, NeX, DeepView Aproach 학습set ($I_1, I_2, I_t. c_1, c_2, c_3$) $I_2$를 Plane Sweep으로 PSV를 만듦. : ($ H * W * 3D$) Tensor Neural Net 네트워크 Input : $I_1, \hat{I_2}$을..

[강화학습] 1주차 Q-learning기초,MDP

혁펜하임님의 트이는 강화학습을 보고 학습 중입니다. 강화학습이란? Machine Learning의 일종. Deep Learning과는 달리 연속된 액션을 구해야할 때 사용 Deep Learning은 한가지의 의사결정을 함 Action, Reward State로 구성되어 있음. Q-Learning이란? Greedy Action을 하며 Reward가 가장 큰 경로를 찾는 과정 Greedy Action : Reward가 큰 쪽으로 Action을 하는 것 problem : 한번 경로를 찾고나면 그 경로가 최적이 아니더라도 그 경로로만 이동함 Explation과 Expolitation의 비율을 조정해 최적의 경로를 찾도록 함 Explation(탐험) : Q값에 상관없이 랜덤으로 이동하여 새로운 경로를 찾아 나서도..

[이미지 품질 평가] SSIM

SSIM Structural Similarity Index Map 수치적 에러가 아닌 인간의 시각적 화질 차이를 평가하기 위해 고안된 방법 밝기, 대비, 구조의 세가지 측면에서 품질을 평가 luminus 밝기 $ l(a,b) = \frac{2 * \mu_a \mu_b + C_1}{\mu_a^2 + \mu_b^2 + C_1} $ contrast 대비 $ c(a,b) = \frac{2 * \sigma_a \sigma_b + C_2}{\sigma_a^2 + \sigma_b^2 + C2}$ structure 구조 $ s(a,b) = \frac{\sigma_{ab} + C3}{\sigma_a\sigma_b + C3}$ $$SSIM(a,b) = [l(a,b)]^a[c(a,b)]^b[s(a,b)] \ = \frac{..

AI/CV 2022.06.30

[이미지 품질 평가] PSNR

Peak Signal to Noise Ratio : 최대 신호 대 잡음 비 신호가 가질 수 있는 최대 전력에 대한 잡음의 전력을 나타낸 것. 이미지의 화질 손실 정보를 평가할 때 사용 MSE를 최적화하면 자연스럽게 높일 수 있는 평가지표. 만일 평가할 이미지가 서로 같다면 MSE가 0이되어 inf가 됨 $$PSNR = 10\log_{10}{MAX^{2} \over MSE}$$ python code import numpy as np import math # input : numpy 배열 def PSNR(img1,img2) : MSE = np.mean((img1-img2)**2) if MSE == 0 : return float('inf') return 10*math.log10(255**2/MSE)

AI/CV 2022.06.30

[Anaconda] 기본 문법

환경 생성 및 삭제 # 생성 conda create -n [envname] python=[version] # 삭제 conda remove -n [envname] --all # 기존환경 복사해서 생성 conda create -n [envname] --clone [src-envname]가상환경 활성화 비활성화 # 활성화 conda activate # 비활성화 conda deactivate가상환경 목록 및 모듈 목록 확인 # 가상환경 목록 conda info --envs # 가상환경의 모듈 목록 conda list번외 # requirment만들기 pip freeze > requirement.txt # coda version 확인 nvcc --versionvisual studio code에서 만든 가상환경 인터..

AI/Anaconda&python 2022.06.29

[기계학습] 1. 기계학습 개요 및 용어

1. 개요 Supervised Learing / 지도학습 문제와 답이 주어져있는과정. Regression(회귀)과 Classification(분류) Unsupervised Learning / 비지도 학습 비지도 학습 답이 주여져 있지 않은 과정 Grouping과 Dimention reduction Semi-supervised Learing / 준 지도학습 라벨데이터를 이용해서 unlabeled 데이터의 label을 추정하고 supervised learning을 진행 Reinforcement Learing / 강화학습 여러번의 시도를 통해 문제를 푸는 패턴을 찾는 기법 트레이닝 샘플도 데이터도 존재하지 않음 Transfer Learing / 전이학습 한군데에서 훈련시킨 모델을 다른 곳에서도 사용하는 방법 ..

AI/MachineLearning 2022.03.22

[Grapics/그래픽스] 1. Grapics 용어들

Grapics? 컴퓨터 그래픽스는 컴퓨터 삽화, 즉 컴퓨터로 표현하는 그림이다. 그림을 표현해주기 위한 디바이스들과 여러 가지 시스템들이 필요하다. 1. Computer Output Device 그래픽스를 컴퓨터로 표현해주기 위한 장치들이다 CRT, LCD, LED, OLED, QLED등이 존재한다. 2. 자주 보게될 용어들 Pixel / 화소 디지털 이미지의 기본적인 단위이며, 사각형의 점이다. Resolution / 해상도 이미지가 몇픽셀로 이루어졌는지 표현하는 말이다. 800x300의 이미지는, 너비 800픽셀, 높이 300픽셀로 이루어진 이미지이다. Culling / 컬링 즉 무언가 골라내서 나머지는 없애는 작업을 말하는데, 그래픽스에서는 이제 모델이 좌표 공간에 놓여있을 때, 카메라에 보이는 부..

AI/Grapics 2022.03.22