
오류: 서버와 연결 시킨 vscode에 vkitti dataset이 올라가지 않는 상황. 원인: 최대 용량 메모리 사이즈가 있었음. 기본 4096MB로 설정되어 있음. vkitti dataset은 14GB 정도 되기 때문에 당연히 올라가지 않음 해결 방법 --max-memory=Newsize 를 통해서 늘려줍니다. 설정을 통해 수정하는 또 다른 방법은 Preference > Setting > Text Editor > Files > Max Memory for Large Files MB 입니다. 여기서 쉽게 바꿔줄 수도 있습니다. 저는 더 크게도 되나 실험해보려고 50000으로 해보았습니다. 아직까진 잘 업로드 되고 있습니다. 이상입니다.

1. tar 파일이란? Tape Archive(테이프 아카이브)의 줄임말입니다. 대체로 tarball이라 부릅니다. 압축 형식은 '*.tar'으로 압축 형식의 일종으로 보이지만, zip 같은 압축 파일은 아니라고 합니다. 다수의 파일을 하나로 묶을 때 사용하는 방법이라고 합니다. 즉, 하나의 단일 파일에 여러 파일을 저장하는데 사용됩니다. 소프트웨어 다운로드와 같이 보관 목적 또는 인터넷을 통해 파일을 보내는데 사용되는 방법입니다. Tar 파일을 열려면 아카이브를 열 수 있는 프로그램 또는 명령어가 필요합니다. 2. tar 파일 여는 방법 zip/unzip으로도 열 수 있습니다. 흔하게 7-zip이 tar 파일을 열고 생성을 모두 지원하는 프로그램으로 쓰이는 듯 합니다. 또한, 명령어로도 파일을 풀 수 ..

MIT의 알고리즘 수업 강의 자료를 참고하였습니다. 왜 정렬하는가? 확실한 응용 사례 MP3 보관함 정렬 전화번호부 정리 검색하기 쉬움 정렬하면 쉬워지는 문제들 중간값 또는 가장 가까운 쌍 찾기 이진 탐색, 통계적 이상치 확인 응용 사례 데이터 압축 컴퓨터 그래픽(화면 렌더링) Finding a median 중간값을 찾아보겠습니다. 정렬되지 않은 배열 A를 정렬된 B로 바꾸려고 합니다. array A[0:n] → B[0:n] unsorted → B[n/2] 입력값으로 비교 함수를 갖는 정렬 알고리즘이 있다면 충분한 시간이 흐른 뒤에 정렬된 배열 B를 얻을 수 있음 정렬된 배열이 있다면 상수의 시간이 걸림 Binary Search 이진 탐색을 하는 경우입니다. A[0:n] looking for specif..

자료 출처: CS5670 Structure from motion Structure from motion 해당 개념은 2차원 영상으로부터 3차원 정보를 추출하는 것을 의미합니다. 순차적인 이미지 세트로부터 Structure의 3D reconstruction을 진행합니다. ― Multi-view stereo는 camera가 calibrated 되었다고 가정합니다. ― 이 말의 의미는 모든 view에 대해서 Extrinsics와 intrinsics를 알고 있다는 의미입니다. 그 내/외부 파라미터를 구하는 과정을 calibration이라고 합니다. ― 만약 그것을 모를 때 어떻게 calibration을 연산할 수 있을까요? 일반적으로 이것을 strucrture from motion이라 부릅니다. Large-sc..

multiview stere는 임의의 움직임에서 카메라가 획득한 이미지에서 scene depth를 재구성하는 것을 목표로 합니다. 최근 방법은 딥러닝을 통해 이 문제를 해결하며, semantic한 단서를 활용하여 textureless region과 reflective region 같은 문제를 처리합니다. DPSNET: END-TO-END DEEP PLANE SWEEP STEREO의 논문은 DPSNet이란 conv net을 제시합니다. 해당 컨볼루션 네트워크는 dense depth map의 reconstruction을 위한 기존 기하학 기반 접근 방식의 사례들에서 영감을 받아 설계되었습니다. 이전의 많은 deep learning의 방법에서는 image paris에서 depth 및 optical flow를 ..

자료 출처: CS5670 Multi-view stereo 이번 강의는 Multi-view stereo에 관한 내용입니다. 이어지는 내용은 13강의 stereo이며, 18강의 two-view geometry와도 이어집니다. 왼쪽과 오른쪽에서 바라봤을 때의 stereo pair이며, disparity를 계산한 map입니다. 이는 로봇과 네비게이션, 비디오 효과에 유용하게 쓰입니다. Multi-view Stereo 똑같은 object와 scene이 있는 여러장의 이미지가 주어진다면 이것들의 3D shape은 연산해서 표현할 수 있습니다. Input: 몇몇의 viewpoints들로부터 교정된 이미지(known intrinsics, extrinsics, projection matrices) Output: 3D o..

Justin Johnson의 Deep Learning for Computer Vision 강의로 Lecture 12: Recurrent Neural Networks 입니다. 이번 강의에서 다루는 내용은 RNN, LSTM, GRU Language modeling Sequence-to-sequence Image captioning Visual question answering 입니다. 이중 RNN, LSTM, GRU 관련된 내용 위주로 다룰 것 같습니다. Recurrent Neural Networks RNN은 sequence를 진행하며 업데이트 해 줄 'internal state'를 갖고 있다는 것이 핵심 아이디어입니다. 모든 스텝마다 vector $x$의 sequence마다 recurrence formul..

이번 포스팅은 RNN과 LSTM에 대해 공부하고 정리하려고 합니다.🚀 이전에 RNN과 LSTM에 대해 따로 정리한 자료가 있습니다. 해당 자료는 일러스트를 이용해서 정리한 자료이니 필요하신 분은 참고하세요. 🔗 Recurrent Neural Networks (순환 신경망) 🔗 Long Short-Term Memory(LSTM) and GRU Recurrent Neural Networks Recurrent Neural Networks은 이전의 inputs을 memory에 기억하는 최초의 algorithms입니다. RNN 아이디어의 시작은 sequential information의 이용이었습니다. 전통적 신경망에서는 모든 inputs과 outputs이 서로 독립적이라 가정합니다. 그러나 많은 task에서 이..
- Total
- Today
- Yesterday
- cs231n
- style transfer
- docker
- 딥러닝
- Unsupervised learning
- 도커 작업
- 파이썬 클래스 다형성
- 퓨샷러닝
- stylegan
- prompt learning
- CNN
- 리눅스 나노 사용
- python
- 서버구글드라이브연동
- 구글드라이브연동
- support set
- 리눅스
- 파이썬
- NLP
- 파이썬 클래스 계층 구조
- 도커
- Prompt
- 도커 컨테이너
- few-shot learning
- 파이썬 딕셔너리
- clip
- 리눅스 nano
- 리눅스 나노
- linux nano
- 프롬프트
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |