rlathflg1234의 등록된 링크

키자드에 등록된 총 9개의 포스트를 확인하실 수 있습니다.

Naver Blog

[Review] Global BIM-point cloud registration and association for construction progress monitoring

발행년도 : 2024년 논문명 : Global BIM-point cloud registration and association for construction progress monitoring 학술지 : Automation in construction, Vol.168 저 자 : Yinqiang Zhang, Liang Lu, Xiaowei Luo, Jia Pan Keywords : Point cloud registration, BIM, CPM 들어가며 오늘 스터디한 논문은 건설현장에서 BIM과 포인트 클라우드 데이터를 자동으로 정합, 연관시켜 건설 진행 상황을 모니터링하는 새로운 알고리즘을 제안합니다. CPM(Construction Progress Monitoring) 관점에서 기존 수동 또는 반자동 방식은 Surveying Control Points 와 동일한 점 쌍을 수작업으로 선택해야 해서 시간이 많이 걸리고 노동 집약적이라는 단점이 있었습니다. 이에 따라 이 논문은 BIM 과

Naver Blog

[용어정리] SfM (Structure from Motion)

jpg 이미지에서 3D 모델링 중 json 파일 생성을 위한 colmap의 원리가 SfM인 것을 알게 되었습니다. 몇번이고 보는데 자꾸 개념을 까먹어서 정리합니다. SfM(Structure from Motion )이란 2D 이미지 시퀀스를 사용하여 3D 장면의 구조(Structure)와 카메라의 위치와 자세(Motion)를 동시에 추정하는 기술입니다. 주로 다수의 이미지를 이용해 객체의 3D 형태와 카메라의 경로를 복원하는 데 사용합니다. SfM의 핵심 원리는 다음과 같습니다. 1) 여러 이미지를 통한 대응점 찾기 : 여러 2D 이미지에서 공통된 특징점(features)를 찾아 서로 대응시킵니다. 2) 카메라 위치 및 방향 추정 3) 3D 구조 계산 한계로는 계산 복잡성, 정확도 의존성, 폐색 문제 등이 거론됩니다. Colmap 다운로드 페이지 (개발자가 아닌이상 소스 코드 빌드 말고 window 버전 설치파일로 다운로드 하는 것을 권고합니다.) https://demuc.de/col

Naver Blog

[용어정리] RANSAC (RANdom SAmple Consensus)

흔히 논문에서 RANSAC이라고 불리는 것은 데이터에서 이상치(Outlier)가 존재할 때도 효과적으로 모델을 추정할 수 있는 반복적인 알고리즘 입니다. RANSAC의 기본 원리는 다음과 같습니다. 대표적인 활용 예시는 직선 피팅이 있습니다. 직선피팅이란 이미지에서 직선을 찾을 때, 잡음이 많거나 이상치가 존재할 경우 RANSAC을 사용하여 정확한 직선을 얻을 수 있습니다. 장점으로는, 이상치(Outlier)에 매우 강함. 상대적으로 구현이 간단함. 일반적인 방법보다 노이즈가 심한 환경에서도 좋은 성능을 보임. 단점으로는, 많은 반복을 요구할 수 있어 계산 비용이 증가할 가능성이 있음. 적절한 반복 횟수 설정이 필요함. 가 있겠습니다.

Naver Blog

[용어정리] RMSE (Root Mean Square Error)

RMSE (Root Mean Square Error, 평균 제곱근 오차)는 예측값과 실제값 사이의 차이를 측정하는 지표로, 보통 논문에서 모델의 정확도를 평가할 때 널리 사용됩니다. 실제값과 예측값 사이의 오차를 직관적으로 이해하는 데 매우 유용합니다. RMSE는 다음과 같은 수식으로 정의됩니다. 즉, 실제값과 예측값의 오차 제곱을 평균한 뒤 제곱근을 씌운 것입니다. RMSE 값이 작을수록 (0에 가까울 수록) 모델이 실제값을 잘 예측하는 것으로 판단됩니다.

Naver Blog

[용어정리] 3D Gaussian splatting

3D Gaussian splatting 은 3D 공간에서 각 점을 가우시안 분포(정규분포 같은 것으로 생각)로 모델링하여 장면을 구성하는 기술입니다. 여기서 가우시안은 다음과 같은 속성을 가집니다. 위치: 3D 공간에서의 좌표 크기: 가우시안의 확산 범위 회전: 방향성 색상: 렌더링에 사용될 색상 정보 이 가우시안들은 2D 이미지에 투영되어 픽셀의 색상을 결정합니다. 가우시안의 확률 밀도 함수는 랜더링 시 점이 주변 공간에 미치는 영향을 부드럽게 표현하는 데 사용되며, 이를 통해 장면의 기하학적 구조와 색상이 자연스럽게 렌더링됩니다. 3D Gaussian splatting의 렌더링 과정은 다음과 같이 진행됩니다: 투영: 3D 공간의 가우시안들을 카메라 시점에 맞춰 2D 평면에 투영합니다. 스플래팅: 투영된 가우시안들을 2D 이미지에 "스플래팅"하여 각 픽셀에 영향을 미칩니다. 스플래팅은 가우시안의 영향을 픽셀에 분산시키는 과정입니다. 합산: 각 픽셀에서 여러 가우시안의 기여도를 합산

Naver Blog

[용어정리] SAM (Segment Anything Model)

CVPR 에서 출간한 논문을 읽던 중 2023년 Meta AI Research에서 공개한 SAM 모델이라는 것을 알게 되었다. SAM은 어떤 이미지든 세그먼트할 수 있는(Segment Anything)능력을 갖춘 모델로, 입력된 이미지의 픽셀을 분석해 객체의 경계를 매우 정확하게 식별하고 분할(Mask)하는 기능을 제공한다. 특히 제로샷(Zero-shot) 성능이 뛰어나 별도의 추가 학습 없이도 다양한 이미지를 정확히 분할할 수 있다는 장점을 갖고 있다. SAM으로 형성된 Mask 결과물 주요 특징은 다음과 같다. Zero-shot Segmentation: SAM의 가장 중요한 특징은 사전 학습된 지식을 바탕으로 별도의 추가 학습(fine-tuning) 없이도, 어떤 이미지에서든 즉각적으로 세그멘테이션이 가능하다. Prompt-based Segmentation: 사용자는 텍스트, 클릭 포인트, 바운딩 박스 등 다양한 형태의 프롬프트를 입력하여 원하는 영역을 손쉽게 분할할 수 있다.

Naver Blog

[용어정리] CLIP (Contrastive Language-Image Pre-training)

CLIP은 OpenAI에서 2021년에 공개한 멀티모달 AI 모델로, 텍스트와 이미지 간의 의미적 연결을 학습하여 다양한 작업(이미지 분류, 이미지 검색, Zero-shot 인식 등)을 수행할 수 있도록 설계된 모델이다. CLIP은 이미지와 텍스트를 공동 임베딩 공간(Shared Embedding Space)에 매핑함으로써, 이미지와 텍스트 사이의 유사성을 계산한다. CLIP의 주요 특징으로는, 1) 멀티모달 임베딩 : 이미지와 텍스트 데이터를 동일한 임베딩 공간에 매핑하여 의미적 유사성을 평가 가능하게 함. 2) 대규모 웹 데이터 학습 : 인터넷상에 존재하는 수억 개의 이미지-텍스트 쌍을 통해 학습함으로써, 광범위한 도메인과 문맥에서 일반화 성능이 뛰어남. 3) Zero-shot Learning : 별도의 추가 학습(fine-tuning) 없이 처음 보는 클래스도 텍스트 설명만으로 바로 인식 가능.

Naver Blog

[용어정리] DINO 모델 (Self-DIstillatioN with NO labels)

DINO 모델은 Self-distillation with no labels라는 학습 방법을 말한다. 2021년 Meta AI reasearch에서 발표했으며, 레이블이 전혀 없는 이미지에서 의미있는 특성을 학습하기 위한 자기지도 학습 방법을 제안했다. 핵심 아이디어는 Teacher-Student 구조를 이용한 지식 증류(Knowledge Distillation)로 Student 네트워크가 Teacher 네트워크의 출력을 예측하도록 훈련시키는 것이다. 여기서 Teacher 네트워크는 Student 네트워크의 가중치를 점진적으로 평균 낸 결과로 만들어져 안정적인 학습 목표를 제공한다. 비전 트랜스포머(Vision Transformer, ViT) 아키텍처를 기반으로 만들어졌으며, 대량의 이미지 데이터에서 강력한 시각적 표현을 학습할 수 있는 점이 특징이다.

Naver Blog

[Review] Towards accurate correspondence between BIM and construction using high-dimensional point c

발행년도 : 2024년 논문명 : Towards accurate correspondence between BIM and construction using high-dimensional point cloud feature tensor 학술지 : Automation in construction, Vol.162 저 자 : Shoujun Jia, Chun Liu, Hangbin Wu, Zhijian Guo, Xuming Peng Keywords : BIM, Point cloud, Semantic segmentation, Point-to-point correspondence, Construction progress monitoring 들어가며 이 연구는 BIM과 실제 건설 현장의 Point cloud 간의 정확한 대응 관계를 설정하는 데 초점을 맞추고 있다. BIM과 건설 데이터 간의 Spatial deviation과 Geometric heterogeneity를 논문에서 해결하고자 하는 주요

1