
자료 출처: CS5670 Stereo 두 이미지 사이에 어떤 차이가 있는 것 같나요? 두 이미지를 번갈아가며 비교해보면 각도에 따른 차이가 있습니다. 이 차이는 objects가 수평으로 조금씩 이동하는 것으로 느낄 수 있고, 이 이동량은 카메라로부터의 거리에 반비례합니다. 가까운 거리에 있는 object일수록 이동이 더 크고, 멀수록 덜 움직입니다. Disparity 각 camera center에 따른 O,O′이 있고, 이들은 3D point의 X로 향합니다. 여기서 f는 focal lenght로 camera center와 image plane 사이까지의 거리를 의미합니다. 또한, 3D point와 baseline 사이의 거리를 Z라 둡니다. baseline의 길이는 b로 둡니다. 삼..

이번 포스팅에서 정리할 내용은 Camera models와 vanishing points와 관련된 내용입니다. 자료는 모두 아래 링크를 바탕으로 정리한 내용임을 밝힙니다. 참고 자료: [Multiple View Geometry in Computer Vision 책 내용 정리 Part 1] Camera model에 대한 내용입니다. pinhole model, principal pount offset, intrinsic parameter matrix, camera calibration matrix에 대한 내용이 나옵니다. 이제 projective camera에 대한 내용 정리를 하며 vanishing points 관련 내용까지 정리해보려 합니다. 카메라 행렬 P에 대해 정리를 했었는데요. 카메라 행렬 $P..

강의 참고 자료: CS5670 Lec 12 이번 강의는 single-view modeling에 대한 내용입니다. 가장 주요하게 다루는 내용은 vanishing point와 line이며 이를 통해 무엇을 계산하고 얻을 수 있는지, 또 계산 방법은 어떻게 되는지에 집중을 하면 좋을 것 같습니다. Ames Room 착시를 이용한 공간으로 멀리 있는 물체는 작게, 가까이 있는 물체는 크게 인식하도록 하였습니다. A의 원래 자리와 A의 보이는 자리가 다르고 B는 같습니다. 우리가 보는 틈새 구멍으로 착시가 발생합니다. Point and line duality 여기에 점과 직선이 있는데, homogeneous notation을 통해 평면 위의 점과 직선에 대해 하나의 동일한 벡터로 표현할 수 있습니다. 이러한 관계..

자료 출처: CS5670 Lec 11 이번 11강은 Panorama에 대한 내용입니다. 저번 강의에서 반복되었던 Projection matrix 개념의 연장선이기도 합니다. Intro 각 이미지를 warping 시키는 방법은 무엇이 있었나요? Homography를 계산하여 수행할 수 있었습니다. 그렇다면 360도 파노라마를 만들기 위해 homography를 사용할 수 있나요? 정답을 먼저 말하면 이 방법으론 360 panorama를 만들 수 없습니다. 대신 이 질문에 대한 아이디어는 이미지를 평면으로 투영하는 것이 될 수 있습니다. Image mosaic 모자이크란 3D로 자연스럽게 해석될 수 있는데 이미지가 공통 평면에 재투영 된다는 점에서 오른쪽의 평면에 모자이크가 형성됨을 알 수 있습니다. 모자이크..

Array(배열) List(리스트) LinkedList(링크드 리스트) Stack(스택) Queue(큐) Dequeue(디큐) Tree(트리) Heap(힙) Graph(그래프) 0. 자료구조와 알고리즘이란? 자료구조는 데이터를 원하는 규칙 또는 목적에 맞게 저장하기 위한 구조입니다. 알고리즘은 자료구조에 쌓인 데이터를 활용하여 어떤 문제를 해결하기 위한 여러 동작의 모임입니다. 1. Array 가장 기본적 자료 구조로, 논리적 저장 순서와 물리적 저장 순서가 일치합니다. 따라서 index로 해당 원소(element)에 접근이 가능합니다. 찾고자 하는 원소의 인덱스 값을 안다면 Big-O(1)에 해당 원소로 접근 가능합니다. 즉, random access 가 가능합니다. 이 말의 뜻은 어떤 위치라도 접근 ..

참고 [1] STFT(Short Time Fourier Transform) - 1편 [2] STFT(Short Time Fourier Transform) 2편 [3] 푸리에 변환과 스펙트럼 1. EEG EEG는 뇌파 신호를 의미합니다. (Electroencephalography의 줄임말) 쉽게 설명하면 두피에서 나오는 전기를 기록하는 방법인데요. 뇌의 뉴런 내의 이온 전류로 인한 전압 변동을 측정한다고 합니다. 여러 전극에서 기록된 일정 기간 동안의 뇌의 활동이 기록됩니다. EEG엔 5가지 주파수 범위가 있음 (연구에 따라 범위는 다르게 정의될 수 있음) channel은 사용된 electrodes의 수이며, 위치에 따라 나뉩니다. sampling rate는 초당 sample Low-pass filter ..

MNE는 MEG, EEG, sEEG, ECoG, NIRS 등의 human neurophysiological data를 exploring, visualizing, analyzing 하기 위한 오픈 소스 파이썬 패키지입니다. Tutorials docs 패키지 사용을 위한 튜토리얼과 공식 문서를 통해 다양한 메서드를 사용할 수 있습니다. 저는 딱 한 번 가볍게 사용해보았지만, 꽤 상세하게 잘 설명되어 있었습니다. 제가 뇌파 데이터 자체가 처음이고 생소해서 낯설었던 점 빼고는 천천히 학습한다면 익힐 수 있을 수도?! 활용되는 곳은 Source Estimation, Machine Learning, Encoding Models, Statistics, Connectivity, Data Visualization 등이 ..

2017년 CVPR에서 발표된 논문 Pyramid Scene Parsing Network입니다. PSPNet이라고 불리며, 주요 키워드는 pyramid pooling module, global context information, different-region-based context aggregation 등이라 볼 수 있습니다. 기본 개념 Semantic Segmentation은 각 픽셀값을 특정 클래스(class)로 분류하는 것 Segmentation과 Detection 차이 Object Detection의 경우, 이미지의 각 class마다 bounding box를 만듦, 객체의 모양을 알 수는 없음 Image segmentation은 각 object마다 pixel-wise mask를 만들어서 obj..
- Total
- Today
- Yesterday
- 파이썬
- CNN
- python
- 파이썬 클래스 다형성
- 퓨샷러닝
- 도커 작업
- 도커
- 리눅스 nano
- 파이썬 딕셔너리
- 도커 컨테이너
- 프롬프트
- cs231n
- clip
- docker
- few-shot learning
- support set
- Prompt
- 딥러닝
- 서버구글드라이브연동
- prompt learning
- style transfer
- 리눅스 나노 사용
- linux nano
- 리눅스 나노
- stylegan
- NLP
- Unsupervised learning
- 리눅스
- 파이썬 클래스 계층 구조
- 구글드라이브연동
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |