자료 출처: CS5670 Structure from motion Structure from motion 해당 개념은 2차원 영상으로부터 3차원 정보를 추출하는 것을 의미합니다. 순차적인 이미지 세트로부터 Structure의 3D reconstruction을 진행합니다. ― Multi-view stereo는 camera가 calibrated 되었다고 가정합니다. ― 이 말의 의미는 모든 view에 대해서 Extrinsics와 intrinsics를 알고 있다는 의미입니다. 그 내/외부 파라미터를 구하는 과정을 calibration이라고 합니다. ― 만약 그것을 모를 때 어떻게 calibration을 연산할 수 있을까요? 일반적으로 이것을 strucrture from motion이라 부릅니다. Large-sc..
자료 출처: CS5670 Multi-view stereo 이번 강의는 Multi-view stereo에 관한 내용입니다. 이어지는 내용은 13강의 stereo이며, 18강의 two-view geometry와도 이어집니다. 왼쪽과 오른쪽에서 바라봤을 때의 stereo pair이며, disparity를 계산한 map입니다. 이는 로봇과 네비게이션, 비디오 효과에 유용하게 쓰입니다. Multi-view Stereo 똑같은 object와 scene이 있는 여러장의 이미지가 주어진다면 이것들의 3D shape은 연산해서 표현할 수 있습니다. Input: 몇몇의 viewpoints들로부터 교정된 이미지(known intrinsics, extrinsics, projection matrices) Output: 3D o..
자료 출처: CS5670 Light & Perception 이번 강의에서 다룰 내용은 Light과 Perception입니다. Properties of light What is light? How do we measure it? How does light propagate? How does light interact with matter? Radiometry 픽셀의 밝기를 결정하는 것은 무엇인가요? What is light? Electromagnetic radiation (EMR) moving along rays in space $R(\lambda)$ is EMR, measured in units of power (watts) $\lambda$ is wavelength Light field We can d..
자료 출처: CS5670 Stereo 두 이미지 사이에 어떤 차이가 있는 것 같나요? 두 이미지를 번갈아가며 비교해보면 각도에 따른 차이가 있습니다. 이 차이는 objects가 수평으로 조금씩 이동하는 것으로 느낄 수 있고, 이 이동량은 카메라로부터의 거리에 반비례합니다. 가까운 거리에 있는 object일수록 이동이 더 크고, 멀수록 덜 움직입니다. Disparity 각 camera center에 따른 $O, O^\prime$이 있고, 이들은 3D point의 $X$로 향합니다. 여기서 f는 focal lenght로 camera center와 image plane 사이까지의 거리를 의미합니다. 또한, 3D point와 baseline 사이의 거리를 Z라 둡니다. baseline의 길이는 b로 둡니다. 삼..
이번 포스팅에서 정리할 내용은 Camera models와 vanishing points와 관련된 내용입니다. 자료는 모두 아래 링크를 바탕으로 정리한 내용임을 밝힙니다. 참고 자료: [Multiple View Geometry in Computer Vision 책 내용 정리 Part 1] Camera model에 대한 내용입니다. pinhole model, principal pount offset, intrinsic parameter matrix, camera calibration matrix에 대한 내용이 나옵니다. 이제 projective camera에 대한 내용 정리를 하며 vanishing points 관련 내용까지 정리해보려 합니다. 카메라 행렬 $P$에 대해 정리를 했었는데요. 카메라 행렬 $P..
강의 참고 자료: CS5670 Lec 12 이번 강의는 single-view modeling에 대한 내용입니다. 가장 주요하게 다루는 내용은 vanishing point와 line이며 이를 통해 무엇을 계산하고 얻을 수 있는지, 또 계산 방법은 어떻게 되는지에 집중을 하면 좋을 것 같습니다. Ames Room 착시를 이용한 공간으로 멀리 있는 물체는 작게, 가까이 있는 물체는 크게 인식하도록 하였습니다. A의 원래 자리와 A의 보이는 자리가 다르고 B는 같습니다. 우리가 보는 틈새 구멍으로 착시가 발생합니다. Point and line duality 여기에 점과 직선이 있는데, homogeneous notation을 통해 평면 위의 점과 직선에 대해 하나의 동일한 벡터로 표현할 수 있습니다. 이러한 관계..
자료 출처: CS5670 Lec 11 이번 11강은 Panorama에 대한 내용입니다. 저번 강의에서 반복되었던 Projection matrix 개념의 연장선이기도 합니다. Intro 각 이미지를 warping 시키는 방법은 무엇이 있었나요? Homography를 계산하여 수행할 수 있었습니다. 그렇다면 360도 파노라마를 만들기 위해 homography를 사용할 수 있나요? 정답을 먼저 말하면 이 방법으론 360 panorama를 만들 수 없습니다. 대신 이 질문에 대한 아이디어는 이미지를 평면으로 투영하는 것이 될 수 있습니다. Image mosaic 모자이크란 3D로 자연스럽게 해석될 수 있는데 이미지가 공통 평면에 재투영 된다는 점에서 오른쪽의 평면에 모자이크가 형성됨을 알 수 있습니다. 모자이크..
자료 출처: CS5670 Cameras, CMU Geometric camera models 저에게 해당 내용들은 굉장히 어렵고 생소합니다. 물론 열심히 공부하고 이해한 것을 바탕으로 정리를 하겠지만, 설명이 다소 장황하고 방대해질 것 같습니다. 핵심 내용만을 보고 싶다면 위의 자료 출처를 참고 부탁드립니다. 감사합니다. 지난 포스팅: [CS5670] Lecture 10: Cameras (1) pinhole, lens camera 지난 포스팅의 경우, camera에 대한 기본적인 이론에 대해 정리하였고, 이번 포스팅은 camera를 배우는 이유가 되는 computer vision을 위한 geometric modeling 부분을 살펴볼 예정입니다. 이제부터 Coordinate system을 통해 projec..
- Total
- Today
- Yesterday
- 구글드라이브서버다운
- 구글드라이브다운
- few-shot learning
- support set
- stylegan
- python
- 파이썬 클래스 다형성
- 서버에다운
- vscode 자동 저장
- 데이터셋다운로드
- Prompt
- Unsupervised learning
- 도커 컨테이너
- CNN
- clip
- 딥러닝
- 프롬프트
- cs231n
- 구글드라이브서버연동
- 서버구글드라이브연동
- 파이썬 딕셔너리
- 구글드라이브연동
- 파이썬 클래스 계층 구조
- docker
- prompt learning
- 파이썬
- 도커
- NLP
- 퓨샷러닝
- style transfer
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |