cslee_official의 등록된 링크

키자드에 등록된 총 477개의 포스트를 확인하실 수 있습니다.

Naver Blog

IT 환경을 혁신하는 하이브리드 컴퓨팅

하이브리드는 다양한 기술과 영역이 결합하여 새로운 형태의 시스템을 만들어내는 개념으로, 주로 성능과 효율성을 극대화하는 데 목적이 있습니다. 예를 들어, 하이브리드 자동차, 로봇, 에너지, 근무 방식, 전쟁 전략 등에서 널리 활용되며, 단순한 '혼합'을 넘어 각 요소의 강점을 최대한 활용해 시너지를 창출하는 것이 핵심입니다. 최근 IT 산업에서도 하이브리드 컴퓨팅(Hybrid Computing)이 주목받고 있습니다. 하이브리드 컴퓨팅이란 하이브리드 컴퓨팅(Hybrid Computing)은 클라우드 컴퓨팅과 온프레미스(On-Premise) 시스템의 장점을 결합하여 최적의 성능과 효율성을 제공하는 기술적 접근 방식입니다. 이를 통해 사용자는 클라우드의 유연성과 확장성, 온프레미스의 보안성과 제어력을 모두 활용할 수 있습니다. 하이브리드 컴퓨팅의 주요 목표는 컴퓨팅 자원의 효과적인 배분과 비용 절감을 이루는 동시에 성능과 에너지 효율성을 극대화하는 것입니다. 특히, 데이터의 민감도에 따라

Naver Blog

국제인공지능대전(AI EXPO KOREA 2025) 이벤트에 초대합니다! BigZami 부스 방문하고 행운의 주인공이 되어 보세요

안녕하세요, AI·빅데이터 솔루션 전문 기업 씨에스리입니다. 씨에스리가 이번 국내 최고 인공지능 전문 국제전시회인 국제인공지능대전(AI EXPO KOREA 2025)에 참여합니다. [전시회 일정] 2025.5.14(수)~2025.5.16(금) 서울 코엑스 COEX Hall A / 부스 C14 씨에스리에서 선보이는 데이터분석 RPA 솔루션 BigZami [ C14 ] 부스로 오세요! [상품안내] 1등 - 에어팟 4세대 2등 - 스타벅스 쿠폰 참여상 - 과자세트 박람회 기간동안 매일매일 C14 부스를 찾아오시는 분들 중 100% 당첨 이벤트 참여 기회가 주어지는데요!! 상품이 아주 어마어마하죠?? A홀 C14 씨에스리 부스에서 만나요!!(**) ️박람회 기간 중 1인 1회만 참여 가능합니다. ️이벤트 시간: 매일 오전 10시 - 오후 2시 *상품소진시 조기 마감될 수 있습니다.

Naver Blog

씨에스리, AI 엑스포서 'RPA·AI 적용 BigZami'로 분석 자동화 기술 선보인다

씨에스리, AI 엑스포서 'RPA·AI 적용 BigZami'로 분석 자동화 기술 선보인다 발행일 : 2025-04-09 09:47 AI·빅데이터 솔루션 전문 기업 씨에스리(대표 이춘식)는 오는 5월 14일부터 16일까지 서울 삼성동 코엑스 1층 A홀에서 열리는 '국제인공지능대전(AI EXPO KOREA 2025)'에 참가한다고 밝혔다. 씨에스리는 이번 전시회에서 자사 데이터 분석 솔루션 'BigZami(빅재미)'에 분석 RPA AI 에이전트 대시보드 모니터링 기능 등 새로운 기술을 탑재해 선보일 예정이다. 이번에 선보이는 데이터 분석 RPA는 반복적인 데이터 수집·정제·분석 과정을 자동화해, 분석 업무 효율성과 정확도를 동시에 높인다. 업무 데이터를 주기적으로 수집하고 사전 정의된 분석 프로세스에 따라 자동으로 결과를 도출한 후, 이를 실시간으로 대시보드에 연동해 시각화하는 구조가 강점이다. 사용자는 복잡한 수식이나 쿼리 없이도 분석 흐름을 RPA로 구성하고, 실행된 결과는 대시보드

Naver Blog

멀티모달 AI, 인간처럼 느끼고 이해하는 인공지능

멀티모달 AI, 인간처럼 느끼고 이해하는 인공지능 멀티모달 AI는 단순히 여러 종류의 데이터를 합치는 것을 넘어, 인간이 다양한 감각을 통해 세상을 인지하고 이해하는 방식과 유사하게 작동합니다. 텍스트, 이미지, 음성, 영상 등 각 데이터 형태는 고유한 '모달리티(modality)'를 가지며, 멀티모달 AI는 이러한 모달리티 간의 복잡한 관계를 학습하고 통합하여 더욱 깊이 있는 이해를 도출합니다. 예를 들어, 영화 속 한 장면을 분석할 때, 멀티모달 AI는 영상 속 등장인물의 표정, 대사, 배경 음악, 상황 설명 텍스트 등을 종합적으로 분석하여 등장인물의 감정을 더욱 정확하게 파악할 수 있습니다. 이는 기존의 단일 모달리티 AI가 제공할 수 없는 풍부한 정보와 맥락을 제공합니다. 멀티모달 AI, 산업 전반의 혁신을 이끌다 멀티모달 AI는 다양한 산업 분야에서 혁신적인 변화를 가져올 잠재력을 지니고 있습니다. 의료 분야 : 환자의 의료 영상, 음성, 유전체 데이터 등을 통합 분석하여

Naver Blog

데이터 드리프트: 머신러닝 모델의 숨은 위협과 대응 전략

한번 잘 만든 머신러닝 모델은 오랫동안 안정적으로 작동할 거라고 생각하기 쉽습니다. 하지만 시간이 지나면서 모델의 예측이 점점 빗나가고 있다면, '데이터 드리프트(Data Drift)'가 발생했을 가능성이 큽니다. 마치 내비게이션이 오래된 지도만 참고하다가 새로 생긴 길을 제대로 안내하지 못하는 것과 비슷한 상황입니다. 데이터 드리프트란 무엇일까요? 데이터 드리프트는 모델이 학습했던 데이터와 실제 운영 환경에서 들어오는 데이터의 분포가 달라지는 현상을 의미합니다. 그 원인은 여러 가지가 있습니다. 환경 변화 – 계절에 따라 소비 패턴이 바뀌거나, 새로운 트렌드가 생길 때 데이터 수집 방식 변화 – 설문 조사 방식이 달라지거나, 센서 장비가 교체될 때 사용자 행동 변화 – 소비자 취향이 변하면서 기존 패턴이 더 이상 유효하지 않을 때 이러한 변화가 발생하면, 기존 모델이 더 이상 데이터를 제대로 해석하지 못하고 성능이 떨어질 수밖에 없습니다. 데이터 드리프트가 모델에 미치는 영향

Naver Blog

AI 기술의 물리적 확장 휴머노이드 로봇

지난 1월, 미국에서 열린 세계 최대의 가전제품 박람회 CES 2025에서는 수많은 혁신적 기술들을 선보였습니다. 이번 전시회는 한마디로 정의하자면, AI 기술이 우리 일상에 더욱 가까이 다가온 전시였습니다. 그동안 스마트폰, 태블릿, 노트북과 같은 스크린 안에서만 작동하던 AI가 이제는 물리적 공간에서의 사용 가능성에 대해 논의되기 시작했습니다. 이번 CES에서 이러한 AI 기술은 '피지컬 AI'라는 이름으로 물리적 공간에서의 활용 가능성을 제시했습니다. 이번 전시회에서는 AI 기술이 어떻게 우리의 물리적 공간에서 다양한 서비스를 제공할 수 있을지에 대한 아이디어들이 폭발적으로 쏟아졌습니다. 특히, 로봇을 통해 AI를 물리적 공간에서 구현하려는 다양한 시도가 주목을 받았습니다. 로봇에 AI를 탑재하여 물리적 공간에서 움직이며 다양한 서비스를 제공하는 아이디어가 많이 나왔습니다. 그러나 이러한 로봇의 필요성에 대해 고민해 볼 필요도 있습니다. 현재도 우리는 충분히 잘 생활하고 있는데

Naver Blog

공공분야 클라우드 도입을 위한 전략방향 ④ :: 공공분야 도입 고려사항

1. 클라우드 컴퓨팅 동향 시사점과 도입 고려사항 1-1. 클라우드컴퓨팅 국내외 동향 시사점 (1) 클라우드컴퓨팅은 IT자원의 효율적 사용, 확장성과 유연성, 시장에 대한 빠른 대응 등의 효과성으로 시장 확대와 함께 시장에 요구에 맞춘 클라우드네이티브, AI클라우드 등의 기술로 발전하고 있음 (2) 이러한 클라우드컴퓨팅의 효과성으로 국내외 클라우드 시장이 급성장하고 있으며, 국내외 민간·정부에서는 클라우드 생태계의 주도권 확보 및 시장 확대 경쟁 심화 (세계) 19.6%성장 예상(7,246달러(‘24년) → 1.1조(’27년))되며, SaaS, 클라우드 네이티브, AI클라우드, 반도체 기술 중심, 초기 가격경쟁력을 통한 Lock-in전략 등 경쟁 (국내) 18.4%성장 예상(‘24년 46억 달러)되며, 해외 클라우드 대비 미성숙 상태로 정부의 공공클라우드 정책에 힘입어 확대되는 중으로 SaaS 정책에 따라 SaaS 확대 중 (3) 클라우드컴퓨팅은 초기에 IT비용 절감을 위해 민간에서

Naver Blog

공공분야 클라우드 도입을 위한 전략방향 ③ :: 클라우드컴퓨팅 정책 동향

1. 클라우드 컴퓨팅 국내외 정책 동향 1-1. 해외 정책 동향 (1) 각국은 데이터경제의 주도권 확보를 위해 클라우드에 투자 최근 미국, 유럽 등 선도국은 그간의 클라우드 활성화 정책과 더불어 자국의 데이터 시장 보호 정책을 병행하는 움직임 국가 연도 정책명 주요 내용 미국 ‘13 Cloud First – 정부기관의 클라우드 선제도입 명시(연간 5.3억달러 예산투입 및 7개 부처에 101개의 클라우드 서비스 도입) – 정부의 클라우드 전용 조달사이트 운영 ‘18 Cloud Smart Strategy – 클라우드 확산에 장애가 되는 기존 보안규정 완화 – ‘21년 연방정부 IT예산 총 33억달러 중 19억달러를 클라우드에 투자 EU ‘16 European Cloud Initiative – 기존 소프트웨어 연구인프라를 활용해 유럽 전 분야의 데이터를 저장공유재사용할 수 있는 클라우드 인프라 구축 계획 수립(‘20년까지 5년간 67억유로 투자) ’20 European Strategy f

Naver Blog

딥시크(Deep Seek)의 등장

중국 AI 딥시크, 엔비디아 주가 급락의 원인 지난 1월 27일, 미국의 거대 반도체 기업인 엔비디아(NVIDIA)의 시가 총액 중 약 846조 원이 하루아침에 증발했습니다. 이는 중국의 인공지능(AI) 딥시크(Deep Seek)가 전날 출시된 데 따른 충격적인 결과였습니다. 딥시크는 중국 기업이 중국 내 인력으로 비교적 짧은 기간에 개발했으며, 미국의 ChatGPT에 비해 1/18도 안 되는 적은 비용으로 비슷한 성능을 내는 것으로 알려졌습니다. 딥시크의 등장은 AI 생태계를 확장할 혁명으로 찬사받기도 하고, 일시적인 흥행일 뿐이라는 박한 평가가 공존합니다. 이로 인해 어마어마한 자본과 기술이 투입되는 AI 패권 전쟁이 본격적으로 시작될 것으로 보입니다. 딥시크와 기존 AI와의 차이점 딥시크는 기존 AI와 몇 가지 주요한 차이점을 보입니다. 첫째, V3 모델은 ChatGPT와 유사한 거대 언어 모델로, 매개 변수가 671억 개에 달합니다. 둘째, R1 모델은 추론 모델로, 추론 성

Naver Blog

공공분야 클라우드 도입을 위한 전략방향 ② :: 클라우드 컴퓨팅 시장동향

1. 국내외 시장 동향 1-1. 해외시장 동향 (1) (세계 시장규모) 2025년 8,240억 달러 규모로 예상되며 CAGR은 19.6%로 2028년에는 1.2조 규모로 성장할 것으로 예상 (전체 규모) Gartner, Inc.의 최신 예측에 따르면 퍼블릭 클라우드 서비스에 대한 전 세계 최종 사용자 지출은 20.4% 증가하여 2024년 총 6,754억 달러로 2023년 5,610억 달러에서 크게 증가할 것으로 예상되며, 이러한 성장은 생성형AI와 Application Modernization에 의해 주도 가트너에 따르면 강력한 성장은 예측기간 동안 계속될 것으로 5년 CAGR 19.6% 기준으로 2027년에 1.1조 달러를 초과할 것으로 전망됨2 [그림 Ⅱ-1] 세계 클라우드 시장규모 전망 (단위: 십억달러) [출처] Gartner(‘21, ’22, ‘23, ’24) 보고서 참고 재구성 (유형별 규모) PaaS와 IaaS가 가장 급격한 성장을 보이고 있으며, IaaS는 2025년에

Naver Blog

Python 방식 데이터분석과 Excel 방식 데이터분석 사이의 딜레마와 해결사례

보안 데이터 분석으로 실시간 대응부터 예측까지?! '보안업체 A'는 첨단 기술과 AI를 적극 도입하여 스마트 보안 시스템을 구축하고, 보다 정교한 위험 예측 및 대응 서비스를 제공하고자 노력하고 있습니다. 이를 위해 빅데이터 분석과 AI 기반의 실시간 위험 감지 시스템을 구축하고, 특정 지역의 보안 위협을 정밀하게 분석하여 선제적인 예방 조치를 강화하고 있습니다. 또한, 대시보드를 활용하여 실시간 위험 데이터를 시각적으로 제공함으로써, 보다 효율적이고 신속한 보안 대응이 가능하도록 하는 등 다양한 시도가 이루어지고 있습니다. Python 방식의 데이터분석 - 강력한 분석력, 그러나 높은 진입 장벽 A사는 정밀한 보안 위협 패턴 분석과 머신러닝 모델 구축을 위해 R과 Python을 활용한 데이터 분석을 시도하였습니다. 이를 통해, 지도학습을 활용한 보안 위협 예측, 다양한 변수 간의 상관관계 분석, 공간 데이터 분석 등 상세하고 정밀한 분석이 가능해졌습니다. 하지만 R과 Python을

Naver Blog

공공분야 클라우드 도입을 위한 전략방향 ① :: 클라우드 컴퓨팅 개요

1. 클라우드 컴퓨팅(Cloud Computing) 개념 1-1. 4차산업 시대, 클라우드 컴퓨팅의 개념과 중요성 (1) (개념) 서버, 스토리지, SW 등 IT자원을 구매·소유하지 않고, 필요시 인터넷을 통하여 on-demand 형태로 원하는 만큼 활용하고 비용을 지불하는 컴퓨팅 방식 (클라우드컴퓨팅 발전 및 이용자 보호에 관한 법률) 집적・공유된 정보통신기기, 정보통신 설비, 소프트웨어 등 정보통신자원을 이용자의 요구나 수요의 변화에 따라 정보통신망을 통하여 신축적으로 이용할 수 있도록 하는 정보 처리 체계 (2) (중요성) 초기에는 개별 서버 단위로 관리되던 컴퓨팅 자원의 효율적인 활용을 통한 비용절감이 초기 확산의 주요 요인이었으나, 인공지능과 빅데이터의 중요성이 커짐에 따라 4차산업혁명 기초 인프라로 부각 [그림 I-1] 클라우드컴퓨팅의 IT자원 활용 방식 [출처] 금융위원회, ‘클라우드컴퓨팅 이용에 따른 컴퓨팅 환경 변화’, 금융권 클라우드 이용 확대 방안, 2018.7

Naver Blog

씨에스리, '재활용 전주기 정보 민간 개방' 민관협의체 회의 주최...전문가 의견 수렴

씨에스리, '재활용 전주기 정보 민간 개방' 민관협의체 회의 주최...전문가 의견 수렴 발행일 : 2025-01-23 17:10 씨에스리는 한국환경공단과 한국지능정보사회진흥원이 주관하는 '재활용 전주기 정보 개방' 국가중점데이터 사업 제3차 민관협의체 회의를 개최됐다. 씨에스리(대표 이춘식)는 지난 22일 한국환경공단과 한국지능정보사회진흥원(NIA)이 주관하는 '재활용 전주기 정보 개방' 국가중점데이터 사업 제3차 민관협의체 회의를 개최했다고 밝혔다. 씨에스리가 사업 수행사로 참여하는 본 사업은 행정안전부가 추진하는 국가중점데이터 개방사업 일환으로, 국가적 파급력이 큰 고부가가치 데이터를 발굴해 공공데이터포털을 통해 민간에 개방하는 프로젝트다. 이번 사업을 통해 빈용기 보증금 제품정보 조회서비스 순환자원인정업체 진위확인 서비스 순환장터 물품 정보 조회서비스 재활용품 회수보상제 거점정보 조회서비스 폐전기전자제품 부과징수 정보 조회서비스 폐기물 처리업체 정보 조회서비스 등 15개 분야

Naver Blog

[IT TREND] 가트너 선정, 2025년 10대 전략 기술 트렌드

세계적인 IT 리서치 회사인 가트너(Garter)는 매년 기업들이 주목해야할 기술 트렌드를 발표하고 있습니다. 이번에도 '2025에 주목해야할 10대 전략 기술 트렌드'를 발표했는데요, 단순한 예측을 넘어 실질적인 비즈니스 전략수립과 혁신을 위한 인사이트를 담고 있습니다. 진 알바레즈(Gene Alvarez) 가트너 수석 부사장은 인간과 기술의 시너지가 계속 확장되는 가운데, 기업들이 책임감 있는 혁신을 통해 미래를 설계해야 한다고 강조했습니다. 2025 주요 트렌드로는 에이전틱 AI AI 거버넌스 플랫폼 허위 정보 보안 양자내성 암호 앰비언트 인비저블 인텔리전스 에너지 효율적 컴퓨팅 하이브리드 컴퓨팅 공간 컴퓨팅 다기능 로봇 신경학적 향상이 선정되었으며, 각각 세 가지의 카테고리로 나눠집니다. AI의 필수요소 및 위험(AI Imperatives and risks) Gartner Top 10 Strategic Technology Trends for 2025 1. 에이전틱 AI(Age

Naver Blog

기기 및 요일별 요인을 고려한 공조기 제어 시스템 지능화

안녕하세요!! 빅재미입니다. 2025 을미년 새해가 밝았습니다ㅎㅎ 올해도 새로운 마음으로 데이터분석을 어떻게 활용할 수 있는지 알아보시죠~ 오늘은 공조기 제어 데이터를 이용해 공조기별, 시간별, 요일별 패턴을 파악하고 외기댐퍼 개도값 예측모델을 만들어 볼게요!! [분석 목표] - 공조기 및 시간별 실내외 온도 및 대기정보 패턴을 파악함 - 공조기, 요일, 실내외 대기 정보를 활용하여 공조기 제어값(외기 댐퍼 개도값)을 예측하는 모델을 개발함 활용 데이터 이번 분석에서 사용할 데이터는 공조기 제어 데이터로, 2022년 8월 12일부터 9월 30일까지 10분동안 수집된 데이터입니다. - 2022년 8월 12일부터 9월 30일까지 10분동안 수집한 공조기 제어 데이터 - 크기: 35,458행, 12열 - 컬럼 정보 컬럼명 설명 예시 공조기번호 공조기 1번 ~ 5번 1, 2, 3 외부평균온도 1시간 실외 평균 온도 25, 24, 0 평균댐퍼값(직전1시간) 1시간 평균 댐퍼값 0.05, 0

Naver Blog

공정주요 장비의 특성 분석

안녕하세요!! 빅재미입니다. 작업 공정에서 기기별 특성과 상태를 확인하는 것은 필수 요소인데요! 오늘은 공정 기기(작업솥)별로 점도와 시간 등 분포를 확인하여 기기별 차이를 파악하고, 어떤 특성이 공정과정에 영향을 미치는지 알아보도록 하겠습니다~ [기대효과] - 공정 기기별 특성을 파악하여 설비 상태를 확인 - 향후 발생할 수 있는 고장 및 불량품 생산 등을 사전에 예상하여 예지보전에 활용 활용 데이터 이번 분석에서 사용할 데이터는 앙금 조림 공정 데이터입니다. - 앙금 조림 공정 데이터 - 크기: 113행, 16열 - 컬럼 정보 컬럼명 설명 예시 작업자 공정 작업자 A, B 작업솥 공정 작업솥(니더) 6, 7, 10 물사용량 공정에 사용한 물의 양 20, 22, 19 100도 도달시간 100도까지 도달하는 데에 걸린 시간(분) 19, 22, 20 100도 도달시간 이탈 표준규격 이탈 여부 1: 이탈 / 0: 정상 1, 0 흡입기 가동시간 흡입기를 가동한 총 시간(분) 74, 73,

Naver Blog

[CSLEE] BigZami와 함께 마무리도 따뜻하게, 새로운 시작도 힘차게!

Naver Blog

씨에스리, 생성형 AI 활용 보도자료 작성·민원 대응 서비스 개발...양산시 시범 운영

씨에스리, 생성형 AI 활용 보도자료 작성·민원 대응 서비스 개발...양산시 시범 운영 발행일 : 2024-12-30 06:00 AI 보도자료 생성 서비스 화면 인공지능(AI) 전문기업 씨에스리(대표 이춘식)가 생성형 AI 기술을 기반으로 보도자료 작성과 민원 대응 서비스를 개발했다고 밝혔다. 서비스는 보도자료, 공문, 기사 작성 자동화와 민원 대응을 통해 반복 행정업무를 획기적으로 개선, 양산시에 시범 적용됐다. 씨에스리는 RAG(Retrieval-Augmented Generation) 기술로 정확하고 신뢰성 높은 정보를 제공해 서비스 품질을 높이고, 할루시네이션 이슈도 개선했다. 자체 개발한 개인정보 필터링 솔루션으로 생성형 AI 보안 이슈를 해결해 데이터 안전성을 강화했다. 이번 생성형 AI 서비스는 전국 지자체, 공공기관뿐만 아니라 민간 기업에서도 활용할 수 있다. 보도자료, 공문, 기업 홍보용 기사 작성 등 다양한 문서 업무에 AI 기술을 적용할 수 있어 행정 및 기업 업무

Naver Blog

[Tech 리포트] 생성형 AI를 활용한 데이터 모델링

생성형 AI(Claude)와 전문 데이터 모델링 도구(ERgrin)로 구축하는 ‘온라인 상거래 플랫폼’ 개념&논리 모델링 씨에스리_임승민 ‘대용량 테이블 구축’을 위한 데이터 모델링 수행 중, 생성형 AI가 데이터 모델링에 어느 수준까지 실사용 가능한지 개념 모델링 과정에 Claude 3.5 Sonnet 을 사용해 보았습니다. 해당 모델링은 ‘온라인 상거래 플랫폼’을 비즈니스 도메인으로 설정하여 1단계 ‘생성형 AI를 활용한 개념 모델링’과 2단계 ‘ERgrin을 활용한 논리 모델링’, 3단계 ‘오라클 DB에 구현하는 물리 모델링’으로 이루어져 있으며, 이번 글에서는 1, 2단계인 생성형 AI와 ERgrin을 활용한 개념&논리 모델링를 다룹니다. 1.생성형 AI Claude 3.5 sonnet Claude는 Anthropic이 개발한 고급 추론과 비전 분석, 코드 생성, 다국어 처리에 특화된 생성형 AI로, 지난 2023년 2월 처음 출시 되었습니다. 2024년 7월 28일 Clau

Naver Blog

[전문가 칼럼] 아이패드와 빅재미

씨에스리_이춘식 대표이사 처음 아이패드가 출시되었을 때 이런 생각이 들었다. ‘이미 노트북을 휴대해 이동하면서 사용할 수 있고, 스마트폰으로 정보 등을 충분히 처리 가능한데 굳이 아이패드 같은 디바이스가 또 필요 있을까?’ ‘과연 이 기계가 사람들 속에 확산이 될 수 있을까?’ 2010년 2월에 애플의 前 CEO 스티브 잡스는 아이패드를 발표할 때 거실처럼 꾸민 무대에 앉아 아이패드를 소개했다. 잡스는 아이패드가 거실을 지배할 것이라고 생각한 것이다. 난, 요즘 퇴근하면 일단 스마트폰은 충전해놓고 그다음 손에 드는 디바이스가 아이패드가 되어 있다. 일단 화면이 충분히 크고 노트북과 같은 부팅이 필요 없으며, 거추장스럽지 않으면서 필요한 정보와 영상, 그리고 간단한 업무처리 등이 쉽게 가능하기 때문에 패드가 1순위 디바이스가 되어 활용되고 있다. 사람들이 어떻게 생활하는지 다 알 수는 없지만, 적어도 나에게는 아이패드가 15년 전에 스티브 잡스가 프레젠테이션을 통해 연출했던 그 모습

Naver Blog

뉴스레터 [빅재미 주간소식 2024.11.21]

2024/11 Vol.38 안녕하세요. BigZami입니다. 첫눈이 내리는 소설(小雪)을 앞두고 있습니다. 추워진 날씨에 모두 건강 유의하시기 바랍니다. 오늘은 RFM 기법을 활용한 고객 세분화 시나리오, 데이터웨어하우스와 OLAP, 빅재미 사용 매뉴얼(군집분석)을 소개해 드립니다. RFM 분석은 고객의 구매 행동을 분석하는 데 사용되는 지표로, Recency(최근성), Frequency(빈도), Monetary(구매 금액)를 의미합니다. RFM 분석으로 고객 데이터 기반 고객가치를 측정하고, 마케팅 전략을 수립해 고객관리를 할 수 있습니다. 실제로 어떻게 분석되어 사용되는지 알아보겠습니다. 활용 데이터 분석 요약 <빅재미 워크플로우> 쇼핑몰 거래 데이터를 활용하여 주요 고객 특성에 적합한 마케팅 전략을 수립할 수 있습니다. 이번 분석에서는 UCI에서 제공하는 오픈 데이터를 활용하여 군집분석을 진행했습니다. 첫째, 데이터를 확인하여 결측치, 이상치의 여부를 파악하고 데이터의

Naver Blog

가정 에너지 관리를 위한 가구 전력 사용량 예측

안녕하세요!! 빅재미입니다. 가정에서는 TV, 에어컨, 세탁기, 냉장고, 전자레인지 등 다양한 가전제품을 이용하고 있는데요~ 시계열 회귀분석으로 전력 사용량 데이터를 학습하여 월 전력 사용량을 예측하는 모델을 개발해 에너지 관리의 효율을 높여볼까요? [기대효과] - 기존 전기 사용량 패턴을 분석하여 미래의 전력량 예측 가능 - 전기 사용량 모니터링 및 에너지 소비 관리 플랫폼 사업에 활용 활용 데이터 이번 분석에서 사용할 데이터는 가구 전력 소비량 데이터로, 2006년 12월 16일 17시 24분부터 2010년 11월 26일 21시 2분까지 약 4년 동안 1분씩 수집된 데이터입니다. - 크기: 216,075,259행, 9열 - 출처: University of California at Irvine (UCI) Machining Learning Repository - 컬럼 정보 컬럼명 설명 예시 dt dd/mm/yyyy 형식의 날짜 16/12/2006 Time hh:mm:ss 형식의 시간

Naver Blog

뉴스레터 [빅재미 주간소식 2024.11.28]

2024/11 Vol.39 안녕하세요. BigZami입니다. 찬바람과 함께 겨울이 찾아왔습니다. ️ BigZami 뉴스레터와 함께 행복한 연말 보내시기 바랍니다. 오늘은 가정 에너지 관리를 위한 가구 전력 사용량 예측, 빅재미 사용 매뉴얼(시계열 분석)을 소개해 드립니다. 가정에서는 TV, 에어컨, 세탁기, 냉장고, 전자레인지 등 다양한 가전제품을 이용하고 있습니다. 시계열 회귀분석으로 전력 사용량 데이터를 학습하여 월 전력 사용량을 예측하는 모델을 개발하고, 에너지 관리 효율을 높이는 방법을 알아보겠습니다. 활용 데이터 분석 요약 ‘가구 전력 사용량 패턴 분석’ 템플릿으로 데이터 패턴을 파악한 후, 2007년~2009년 데이터로 모델을 학습하여 2010년 월 전력 사용량을 예측해보았습니다. 첫째, 데이터를 확인하고 결측치를 제거한 후, 학습 데이터와 테스트 데이터를 분리함 둘째, 기존 데이터가 1분 단위로 수집한 전력 데이터이므로, 월 단위로 합산함 셋째, ARIMA 모델로

Naver Blog

에너지 효율화를 위한 건물 특성 파악 및 예측

안녕하세요!! 빅재미입니다. 어딜가나 겨울철과 여름철마다 냉난방은 필수 요소인데요. 건물의 어떤 구성요소가 냉난방에 영향을 끼치는지 알 수 있다면, 설계 초기에 조금 더 많은 선택지를 가지고 갈 수 있겠죠? 건물 특징 데이터를 이용한 냉각부하 및 난반부하 예측모델 학습을 통해 어떤 요소들이 영향을 미치는지 파악해보도록 할게요!! [기대효과] - 에너지 절약을 위해서 건물 설계 시 고려해야하는 점이 무엇인지 파악할 수 있음 - 에너지 사용량 및 비용 절감을 위한 효율적인 건물 에너지 관리 방안을 마련할 수 있음 활용 데이터 이번 분석에서 사용할 데이터는 건물 특징 데이터로, 도시 건축 엔지니어 Angeliki Xifara와 산업·응용 수학 교수 Athanasios Tsanas가 수집한 데이터입니다. - 크기: 216,075,259행, 9열 - 출처: University of California at Irvine (UCI) Machining Learning Repository - 컬럼

Naver Blog

[전문가 칼럼] 데이터 웨어하우스와 OLAP

씨에스리_이춘식 대표이사 빅데이터와 데이터 분석이라는 용어를 많이 사용하기 전부터 데이터 웨어하우스(data warehous) 또는 OLAP이라는 단어를 많이 사용하였다. 이번에는 이 두 가지에 대해서 간단히 살펴보고자 한다. 일반적으로 업무를 처리하는 시스템을 온라인 트랜잭션 처리(on-line transaction processing), 즉 OLTP라고 한다. OLTP를 통해 이미 구축된 정보를 기업의 업무적인 요구에 따라 다양한 관점으로 분석하여 보여주는 시스템이 바로 ‘데이터 웨어하우스 시스템’이다. 일반적인 업무 처리를 위한 시스템이 가장 의미를 두는 요소가 데이터의 정합성이라면, 데이터 웨어하우스는 이미 구축되어 있는 정보를 활용하는 측면이 강하므로 빠른 시간 안에 데이터를 사용자에게 효과적으로 보여줘야 한다. 1992년, INMON이 정의한 바에 따르면 데이터 웨어하우스는 운영 중인 데이터베이스 및 외부의 데이터 소스에서 필요한 데이터를 추출하여 기업의 경영을 위한 분석

Naver Blog

씨에스리, 제조분야 디지털 혁신 선도할 AI 전문인력 배출 성과 발표

씨에스리, 제조분야 디지털 혁신 선도할 AI 전문인력 배출 성과 발표 발행일 : 2024-11-13 17:11 씨에스리는 지난 12일 '산업전문인력 AI역량강화 지원사업 성과공유회'에서 제조분야 AI 전문인력 배출 성과를 발표했다. 빅데이터·인공지능(AI) 전문기업 씨에스리(대표 이춘식)는 지난 12일 '산업전문인력 AI역량강화 지원사업 성과공유회'에서 제조분야 AI 전문인력 배출 성과를 발표했다고 밝혔다. 산업전문인력 AI역량강화 지원사업은 정보통신산업진흥원(NIPA)이 전담하는 정부 지원사업으로, 서울테크노파크와 씨에스리가 컨소시엄으로 참여해 작년부터 총 758명에 달하는 제조분야 디지털 혁신 전문가를 양성하고 있다. 씨에스리는 제조 산업군 수요조사를 기반으로 재직자 대상 5개 과정과 AI융합전문가 1개 과정을 체계적으로 설계한 후 약 2년간 39회에 걸쳐 전문교육과정을 운영했다. 이를 통해 제조 분야에 AI 고도화를 적용할 전문가 523명, 제조산업 맞춤 도메인 지식을 갖춘 I

Naver Blog

고객 맞춤형 마케팅 전략 수립을 위한 고객 세분화(RFM 기법 활용)

안녕하세요!! 빅재미입니다. RFM 분석은 고객의 구매 행동을 분석하는 데 사용되는 지표로, Recency(최근성), Frequency(빈도), Monetary(구매 금액)를 의미합니다. RFM 분석으로 고객 데이터 기반 고객가치를 측정하고 마케팅 전략을 수립해 고객관리를 할 수 있는데요~ 실제로 어떻게 분석되어 사용되는지 함께 알아볼까요? [기대효과] - 소비 트렌드를 파악하고 고객 특성에 적합한 마케팅 전략을 수립할 수 있다 - 소비 유형별로 고객을 관리하여 고객 유지율을 높이는 전략을 세울 수 있다 활용 데이터 이번 분석에서 사용할 데이터는 거래 내역 데이터로, 데이터를 군집분석(클러스터링) 기법을 활용하여 거래 특성에 따른 고객 세그먼트를 분류했습니다. [RFM 모델 기반의 시장 세분화] R: 구매의 최근성(Recency). 얼마나 최근에 구입했는가 F: 구매 빈도(Frequency). 얼마나 자주 상품을 구입했는가 M: 총 구매 금액(Monetary). 구입했던 총 금액은

Naver Blog

식품 공정작업자의 숙련도 평가와 품질유지 시스템

안녕하세요!! 빅재미입니다. 작업 공정에서 표준 규격을 준수하는 것은 가장 중요한 일이며, 모든 작업자는 표준화된 절차에 따라 작업을 수행해야 합니다. 하지만 숙련도에 따라 편차가 발생할 수 있는데요!! 품질관리 항목에 대한 작업자별 평가 결과 분포를 확인하여 작업자의 숙련도를 평가하고, 일관성 있게 관리하려면 어떤 시스템을 구축해야 하는지 알아보도록 하겠습니다~ [기대효과] - 작업자의 숙련도를 측정하는 시스템을 구축하는 데에 활용하여 작업자별 숙련도 편차를 제어할 수 있음 - 작업을 표준화하여 지속적인 품질 관리를 통해 최적의 품질을 유지하는 시스템을 구축할 수 있음 활용 데이터 이번 분석에서 사용할 데이터는 앙금 조림 공정 데이터입니다. - 앙금 조림 공정 데이터 - 크기: 113행, 16열 - 컬럼 정보 컬럼명 설명 예시 작업자 공정 작업자 A, B 작업솥 공정 작업솥(니더) 6, 7, 10 물사용량 공정에 사용한 물의 양 20, 22, 19 100도 도달시간 100도까지 도

Naver Blog

씨에스리, ASOCIO DX 어워드 2024서 퍼블릭/프라이빗 파트너십 부문 수상

씨에스리, ASOCIO DX 어워드 2024서 퍼블릭/프라이빗 파트너십 부문 수상 발행일 : 2024-11-08 13:53 이춘식 씨에스리 대표가 DX Award Public/Private Partnership Award 부문에서 수상했다. 빅데이터·인공지능(AI) 전문기업 씨에스리(대표 이춘식)가 ASOCIO DX Award 2024에 참가해 DX 퍼블릭/프라이빗 파트너십 어워드((Public/Private Partnership Award) 부문 수상의 영예를 안았다고 8일 밝혔다. ASOCIO DX Award는 아시아대양주정보산업기구(ASOCIO)가 회원국 내 디지털 혁신을 선도하는 우수 기업과 기관을 선정해 시상하는 프로그램이다. 2024년 시상식은 지난 7일 일본 도쿄에서 개최됐다. 올해 DX 퍼블릭/프라이빗 파트너십 어워드 부문 한국 측 수상기업 중 민간기업은 총 9개사다. 씨에스리는 데이터를 기반으로 공공과 민간을 넘어 일상에 4차산업 기술 분야의 차별화된 경험을 제공한다

Naver Blog

[MI] Apriori를 통한 고객 구매 패턴 분석

안녕하세요!! 빅재미입니다. 물품을 판매하기 위해서는 고객들의 행동을 이해하고 이 행동을 구매 패턴과 연관하여 파악할 수 있는 발판이 필요합니다! 고객들의 구매하는 품목 간의 관계를 파악하고 구매 패턴에 기반한 상품 배치 및 고객 동선 설계, 추천 시스템 구축 등 매출 향상을 위한 의사결정에 도움이 되는 방법을 알아볼게요~ㅎㅎ 활용 데이터 이번 분석에서 사용할 데이터는 트랜잭션 데이터로, 거래ID와 거래품목이 1:1로 기재되어 있는 트랜잭션 데이터가 포함되어 있습니다. - 크기: 4개의 columns, 4539개 rows - 출처: https://data.world/zpencer/transaction-itemset 컬럼명 설명 POS_Txn 거래번호 Dept 거래품목 ID 품목번호 Sales_U 거래량 데이터 예시) - Dept의 경우 "일련번호:제품카테고리"로 기재되어 있어 전처리 필요 - Sales_U가 음수 값이 있는 것으로 보아 환불 거래 내역도 포함되어 있을 것으로 추측 분

Naver Blog

[2024 재정데이터 분석교육] 재정데이터분석 미니프로젝트 모집

안녕하세요 BigZami입니다! [2024년 재정데이터 분석 교육] 재정데이터분석 미니 프로젝트 참가자 모집 안내 전해드립니다! 자세한 내용은 아래를 참고해주세요 <공지 링크> https://edu.openfiscaldata.go.kr/board/read.jsp?id=23&code=notice <과정신청 링크> https://edu.openfiscaldata.go.kr/course/course_view.jsp?id=16&cid=7&ch=course2

Naver Blog

[2024 산업인력 AI역량강화] 제조산업 전문인력 AI 역량강화 교육 모집(교육비 전액 지원, 온라인 무료교육)

안녕하세요 BigZami입니다! [2024 산업인력 AI역량강화] 제조산업 전문인력 AI 역량강화 교육 모집 소식을 전해드립니다! 교육비 전액 지원과, 온라인 무료교육까지 가능하니 자세한 내용은 아래를 참고해주세요~ 신청링크 https://forms.gle/8ma9G5qrBUaTBGHD7 신청링크 https://stp.onilifo.co.kr/

Naver Blog

[전문가 칼럼] 잘 정의된 분석 데이터모델의 특징

씨에스리_이춘식 대표이사 데이터설계를 할 때, 데이터를 모델링하는 방법은 오직 한 가지의 절대적인 방법만 존재하는 것이 아니라는 점을 꼭 기억해야 한다. 실제 프로젝트 중 데이터 모델링을 진행하다 보면 다른 사람의 업무를 간섭할 수밖에 없다. 그러나, 자신의 의견을 너무 강하게 주장하면 작업을 진행하기도 전에 갈등으로 인해 일의 진행이 어렵게 되는 경우가 많다. 항상 다른 의견도 존중하며, 방법적으로 서로 다른 부분이 있음을 인정하고 작업을 진행해야 할 것이다. 그렇다고 모든 방법이 다 용인이 되는 것은 아니다. 마치 바둑을 두는 것처럼 상대방의 수에 따라 다양한 방식의 착점이 가능한 것처럼 여러 가지의 좋은 방법이 있다는 것이지, 아무렇게나 두는 방법을 용인하는 것은 아니다. 내공이 잘 준비된 사람이 바둑을 두는 수준의 토론은 얼마든지 해야 하겠지만, 상대방이 아직 초보 수준의 기술을 가지고 있다면 인내심을 가지고 설명을 하면서 좋은 방식의 데이터 모델링으로 만들어 가야 한다. 또

Naver Blog

뉴스레터 [빅재미 주간소식 2024.11.1]

2024/11 Vol.35 안녕하세요. BigZami입니다. 11월의 첫 뉴스레터가 찾아왔습니다. BigZami로 하는 경찰청 치안활동과 CO2 발생량 예측 분석 시나리오, 데이터 설계 시 꼭 챙겨야 할 사항을 소개해 드립니다. 씨에스리에서는 자사의 AI 데이터 분석 솔루션 '빅재미(BigZami)'를 적용한 경찰청 데이터 기반 과학적 치안 활동 사례를 지난 23일부터 26일까지 인천 송도 컨벤시아에서 열린 국제치안산업대전(Korea Police World Expo)에서 소개했다고 밝혔습니다. 씨에스리는 경찰청 데이터정책팀과 함께 빅데이터 플랫폼 표준 분석 모델 개발 사업을 진행하였습니다. 빅재미를 이용한 CPO 범죄 예방 분석 모델, 기동 순찰대 배치 장소 선정 모델, AI 기반 정보 공개 청구 자동 비식별화 프로그램 등의 서비스를 개발하였습니다. 이를 통해 범죄 예방 분석 요구 사항을 분석하고, 데이터 통합 전처리 및 분석 모델과 시스템을 개발하여 배포했습니다. 빅재미는 오토엠

Naver Blog

뉴스레터 [빅재미 주간소식 2024.11.7]

2024/11 Vol.36 안녕하세요. BigZami입니다. 입동과 함께 추워진 날씨에 모두 감기 유의하시기 바랍니다!! 오늘은 Apriori를 통한 고객 구매 패턴 분석과 잘 정의된 분석 데이터모델의 특징, 빅재미 사용 매뉴얼(분석기능)을 소개해 드립니다. 물품을 판매하기 위해서는 고객들의 행동을 이해하고, 이 행동을 구매 패턴과 연관하여 파악할 수 있는 기반이 필요합니다. 고객들이 구매하는 품목 간의 관계를 분석하고, 구매 패턴에 기반한 상품 배치 및 고객 동선 설계, 추천 시스템 구축 등 매출 향상을 위한 의사 결정에 도움이 되는 방법을 알아보겠습니다. 활용 데이터 이번 분석에서 사용할 데이터는 트랜잭션 데이터로, 거래ID와 거래품목이 1:1로 기재되어 있는 트랜잭션 데이터가 포함되어 있습니다. 분석 요약 [데이터 전처리] 장바구니 분석 수행 시, Dept 컬럼에서 제품 카테고리명만 추출하는 작업을 수행하고 필요 컬럼을 선택 추출 및 컬럼명 변경하여 분석결과 해석 시 가독

Naver Blog

씨에스리, '빅재미' 적용한 경찰청 과학적 치안사례 국제치안산업대전서 선보여

씨에스리, '빅재미' 적용한 경찰청 과학적 치안사례 국제치안산업대전서 선보여 발행일 : 2024-10-30 16:47 경찰청에서 빅재미를 활용한 데이터 기반 과학적 치안활동을 선보이고 있다. 씨에스리(대표 이춘식)는 자사 AI 데이터 분석 솔루션 '빅재미(BigZami)'를 적용한 경찰청 데이터 기반 과학적 치안 활동 사례를 지난 23일부터 26일까지 인천송도컨벤시아에서 열린 국제치안산업대전(Korea Police World Expo)서 소개했다고 밝혔다. 씨에스리는 경찰청 데이터정책팀과 빅데이터 플랫폼 표준분석모델 개발사업을 진행했다. 빅재미를 이용한 CPO 범죄예방분석 모델, 기동순찰대 배치장소 선정 모델, AI기반 정보공개청구 자동 비식별화 프로그램 등 서비스를 개발했다. 이를 통해 범죄예방분석 요구사항을 분석하고, 데이터 통합 전처리와 분석 모델 및 시스템 개발해 배포했다. 빅재미는 오토엠엘(AutoML) 기술 등 4차 산업혁명 핵심인 AI 기술 적용을 통해 전처리 시간을 절

Naver Blog

[전문가 칼럼] 데이터설계 시 꼭 챙겨야 할 사항

씨에스리_이춘식 대표이사 데이터설계를 할 때 설계를 어떻게 하느냐에 따라 데이터베이스의 견고함과 성능은 어마어마한 차이를 보이게 된다. 이번 본문에서는 실무에서 많이 오해하거나 심각하게 실수하는 부분만을 정리하여 데이터설계 시 어떤 점을 고려해야 하는지에 대한 내용을 간단하게 제시한다. 개별적인 엔터티와 관계로 표현되는 데이터모델링 기법이 그동안 전통적으로 많이 사용됐다면, 최근에는 데이터 모델링 표현방식에 있어 업무의 구성이나 흐름을 좀 더 정교하게 표현하고자 하는 실무적인 기법이 증가하고 있다. 이 중 단순히 엔터티와의 관계만을 가지고 표현하는 전통적 데이터모델의 단점을 보완하여 객체지향의 장점을 보완한 모델이 확장형 데이터모델이다. 이 모델은 객체지향의 상속구조를 데이터모델링의 슈퍼타입과 서브타입으로 표현하고, 하나의 엔터티에 여러 개의 속성값을 가지는 집단화 타입을 지정하기도 한다. 이처럼 데이터설계 시 실무적으로 꼭 알아야 하는 몇 가지 영역은 다음과 같다. 1. DB의 출

Naver Blog

뉴스레터 [빅재미 주간소식 2024.10.24]

2024/10 Vol.34 안녕하세요. BigZami입니다. 시원한 바람과 함께 10월의 세 번째 뉴스레터가 찾아왔습니다. BigZami로 IT 트렌드를 알아볼까요? 전 세계적으로 제조업들은 스마트팩토리를 도입하여 공정 개선 및 발전하고 있습니다. 스마트팩토리란? AI, IoT, 빅데이터 등 첨단 기술을 활용하여 제조 공정을 자동화하고 최적화한 지능형 공장을 의미합니다. 즉, 제조/생산 공정에 디지털 기술을 접목하여 데이터의 수집과 연결, 분석, 예측을 통해 최적의 공정라인을 실행합니다. 이 때 수집된 공정데이터를 활용하면 기계 고장 유형도 예측할 수 있습니다. 오늘은 고장 유형을 예측하여 유형별 특징을 파악하고 기계 관리에 활용할 수 있는 방법을 알아보겠습니다. 전문 읽으러 가기 데이터로부터 발생할 수 있는 세 가지 허상은 무엇일까요? 데이터를 기반으로 의사결정을 했으니 체계적이고 과학적이며 합리적으로 의사결정을 했다고 말할 수 있습니다. 하지만 데이터는 다양한 허상을 제공할

Naver Blog

[전문가 칼럼] 데이터로부터 발생 될 수 있는 세 가지 허상은 무엇이 있을까?

씨에스리_이춘식 대표이사 데이터로부터 의사결정을 했으니 체계적이고 과학적이고 합리적으로 의사결정을 했다고 할 수 있다. 그러나 데이터는 다양한 허상을 제공할 수 있고, 그로 인해 잘못된 의사결정을 이끌어낼 수 있다는 점을 꼭 기억해야 한다. 이 부분은 데이터가 유용하기는 하나 과신한 나머지 잘못된 의사결정을 이끌어낼 수 있는 '실무에서 자주 발생할 수 있는 사항'에 해당한다. 데이터 기반 허상 또는 잘못된 의사결정은 어떻게 발생할 수 있을까? 당연히 사람이 살아가는 모든 환경에서 데이터가 완벽하게 제공이 되고, 제공되는 데이터 또한 왜곡 없이 그대로 전달 되기만 한다는 가정을 전제로 한다면, 데이터를 기반으로 의사결정을 하는 것이 큰 위험 없이 가장 잘한 의사결정이 될 수 있다. 하지만, 이 전제조건을 충족하는 것 자체가 불가능에 가까운 수준이기 때문에, 그로 인해 잘못된 의사결정을 유발하는 '허상'이 발생할 수 있다. 다음은 대표적인 허상 3가지에 관해서 설명한다. 첫 번째는 결과

Naver Blog

뉴스레터 [빅재미 주간소식 2024.10.17]

2024/10 Vol.33 안녕하세요. BigZami입니다. 가을비가 내리는 10월 셋째 주, BigZami 뉴스레터와 함께 IT 트렌드를 알아볼까요? 2023년 3분기 국내 소프트웨어 산업(패키지SW, IT서비스, 게임SW, 인터넷SW)에 대한 조사 결과, 소프트웨어 생산 규모는 91.3조 원, 소프트웨어 수출 규모는 183.3억 달러, 소프트웨어 산업 종사자 수는 478.1천 명, 소프트웨어 기업 수(2022년 기준)는 64,932개로 집계되었습니다. 출액은 2022년 대비 3.9% 증가, 전문인력은 2022년 대비 19.4% 증가 등 4차 산업 혁명이라는 세계적 흐름 속에서 소프트웨어(SW)의 주요산업은 디지털전환(Digital Transformation)을 통해 지속적인 성장과 경쟁력 제고에 부단한 노력을 기울이고 있습니다. 지속적인 성장과 경쟁력 제고를 위해서 소프트웨어(SW) 품질은 중요한 요소 중 하나입니다. 이를 위해 소프트웨어(SW) 품질에서 빠질수 없는 ISO/I

Naver Blog

산업 전력 소비량 데이터를 활용한 CO2 발생량 예측

안녕하세요!! 빅재미입니다. 현재 철강산업의 전 세계 온실가스 배출량의 약 7~9%를 차지하고 있다고 합니다. 기후변화대응에 있어 많은 기업들이 온실가스 저감기술을 도입해 CO2 배출량을 감축하기 위한 노력을 하고 있습니다. 오늘은 철강산업 에너지 소비 데이터의 각 요소별 상관관계와 Load Type, 요일별, 월별 CO2 현황을 파악해 탄소배출 관리에 활용할 방법을 알아보겠습니다!! [기대효과] Load Type별 특징 파악 및 CO2 배출량을 예측할 수 있고, CO2 발생량을 모니터링하는체계를 구축하여 CO2를 절감할 수 있는 방안을 마련할 수 있다. 활용 데이터 이번 분석에서 사용할 데이터는 여러 종류의 코일, 강판, 철판을 생산하는 대우제철이 제공하는 데이터로 2018년 1월 1일 00:15부터 2018년 12월 31일 00:00까지 1년동안 15분 마다 수집한 철강산업 에너지 소비 데이터가 포함되어 있습니다. - 크기: 35,040행, 11열 - 출처: University

Naver Blog

뉴스레터 [빅재미 주간소식 2024.10.10]

2024/10 Vol.32 안녕하세요. BigZami입니다. 10월의 시작을 BigZami 뉴스레터 소식과 함께하세요! 일교차가 심한 가을 날씨, 모두 건강 유의하시기 바랍니다. 빅데이터ㆍ인공지능(AI) 전문기업 씨에스리가 소프트웨어 실습 환경 서비스 전문기업 소프트웨이즈와 사업 확장 및 AI 인재양성을 위한 협약을 체결했다고 밝혔습니다. 이번 협약으로 씨에스리는 데이터 분야에 특화된 기술력과 전문인력 지원에 적극 나설 예정입니다. 또한 소프트웨이즈의 실습 교육 플랫폼인 버추얼클래스를 통해 더욱 완성도 높은 고객 서비스가 가능해, 버추얼클래스 저변 확대 및 기업 맞춤형 AI 인재를 양성할 수 있을 것으로 기대됩니다. 이번 협약에 활용되는 소프트웨이즈의 주력 서비스 버추얼클래스는 클라우드 기반 영상회의 및 실습환경, 원격 모니터링 등을 제공하는 온라인 강의 플랫폼입니다. 브라우저를 통한 실습 환경을 제공해 단독 학습이 어려운 SW 학습을 시공 제약 없이 실습할 수 있는 학습 환경

Naver Blog

[Tech 리포트] Al기술을 활용한 품질관리 기법

씨에스리_정상록 수석 소프트웨어 품질관리는 오늘날 IT 산업에서 필수적인 요소이다. 신뢰성, 효율성, 유지보수성 등 다양한 품질 속성을 확보하기 위해서는 체계적이고 지속적인 관리가 중요한데, 이러한 상황에서 AI 기술의 발전은 소프트웨어 품질관리 방식을 혁신적으로 변화시키고 있다 본 글에서는 AI를 활용한 소프트웨어 품질관리 기법에 대해 설명해 보고자 한다. 1. AI를 활용한 테스트 자동화 전통적인 테스트 방식에서 자동화는 반복적이고 시간이 많이 소요되는 작업이지만, AI 기술을 활용하게 되면 테스트 시나리오를 자동으로 생성하고 실행할 수 있어 업무의 효율성을 높일수 있다 <AI 기반 테스트 자동화의 주요 요소> 1) 테스트 케이스 생성 및 유지보수 자동화 – 테스트 케이스 생성: AI 알고리즘을 이용하여 소프트웨어의 다양한 시나리오를 생성하고, 이러한 시나리오에 맞는 테스트 케이스를 자동으로 생성할 수 있다. – 테스트 스크립트 유지보수: AI는 코드 변경 사항을 감지하고, 이에

Naver Blog

공정데이터를 활용한 기계 고장 유형 예측

안녕하세요!! 빅재미입니다. 전 세계적으로 제조업들은 스마트팩토리를 도입하여 공정 개선 및 발전하고 있습니다. 스마트팩토리란? AI, IoT, 빅데이터 등 첨단 기술을 활용하여 제조 공정을 자동화하고 최적화한 지능형 공장을 의미합니다. 즉, 제조/생산 공정에 디지털 기술을 접목하여 데이터의 수집과 연결, 분석, 예측을 통해 최적의 공정라인을 실행합니다. 이 때 수집된 공정데이터를 활용하면 기계고장 유형도 예측할 수 있는데요! 오늘은 고장 유형을 예측하여 유형별 특징을 파악하고 기계관리에 활용할 수 있는 방법을 알아보겠습니다ㅎㅎ [기대효과] - 기계의 유지보수를 위 한 효율적인 데이터 관리가 가능하고 기계 고장 유형 을 미리 예측 - 시설관리 기계 가동 제한 등 고장유형별 대처방 안 마련 으로 시간 비용 손실 절감 활용 데이터 이번 분석에서 사용할 데이터는 기계 고장 및 유형 다중 클래스 을 예측하기 위한 데이터로, 해당 데이터에는 제품 품질 유형 및 유형별 번호, 대기온도, 공정온도

Naver Blog

[전문가 칼럼] 빅재미 사례 중심의 국제표준 ISO/IEC 25023의 이해

씨에스리_한지성 수석 국내 소프트웨어(SW) 산업은 2023년 기준으로 SW생산은 약 91.3조원, SW수출은 약 183.3억 달러로 지속적인 SW의 산업이 발전하고 있다. 소프트웨어의 중요성, 품질에 대한 관심은 지속 증가하고 있어 소프트웨어의 품질에 필수적인 국제표준(ISO/IEC 25023)의 이해를 위해 사례중심으로 국제표준의 적용 방법 및 주요 활용 사례를 기술한다. I. 국내 소프트웨어(SW) 산업 현황 2023년 3분기 국내 소프트웨어 산업(패키지SW, IT서비스, 게임SW, 인터넷SW)에 대한 조사 결과, 소프트웨어 생산 규모는 91.3조 원, 소프트웨어 수출 규모는 183.3억 달러, 소프트웨어 산업 종사자 수는 478.1천 명, 소프트웨어 기업 수(2022년 기준)는 64,932개로 집계되었다. [그림1] 2023년 소프트웨어(SW) 산업현황 <자료> SPRi 소프트웨어(SW) 통계 포털 매출액은 2022년 대비 3.9% 증가, 전문인력은 2022년 대비 19.4%

Naver Blog

[전문가 칼럼] 데이터의 발생 유형과 활용을 위한 제언

씨에스리_이춘식 대표이사 데이터를 구분하는 방법은 여러 가지가 있을 수 있으나, 이번 내용에서는 데이터가 발생되는 유형에 따라 분석적 관점에서 어떻게 활용할 수 있을지에 대해 정리하고자 한다. 데이터가 발생되는 유형은 크게 운영데이터, 분석데이터, 연계데이터 그리고 오픈(개방)데이터 이렇게 네 가지로 구분할 수 있다. 운영데이터는 업무처리를 위한 데이터로써 실시간 트랜잭션을 처리하기 위한 데이터에 해당한다. 트랜잭션은 'Logical unit of work'로서 논리적인 작업의 처리의 일련의 단위를 의미한다. 즉, 한사람이 한 지점에서 한번 수행에서 업무적으로 유의미한 결과를 얻을 수 있는 것으로도 이야기할 수 있다. 이렇게 수행된 결과로 데이터를 읽고 쓰고 수정할 수 있는데, 이에 해당하는 데이터를 운영데이터로 부를 수 있다. 이를테면 KTX를 예매하기 위해 열차표를 알아보고 주문하는 데이터는 운영데이터에 해당한다. 데이터의 특징은 개별 건 모두가 엄격한 의미를 가지고 있고, 무결

Naver Blog

뉴스레터 [빅재미 주간소식 2024.9.27]

2024/09 Vol.31 안녕하세요. BigZami입니다. 즐겁고 풍성한 명절 보내셨나요? 가을비가 지나가고, 선선한 날씨와 함께 BigZami 뉴스레터가 찾아왔습니다. 오늘은 씨에스리의 카이스트 AI 교육 원데이 클래스 진행 소식, 관계형 데이터 모델링의 식별자, 빅재미 사용 매뉴얼-전처리1 을 소개해 드립니다. 씨에스리는 9월 26일, 초·중·고 교사 20명을 대상으로 KAIST SW중심대학과 연계하여 ‘AI교육 원데이클래스[3기]’를 진행했습니다. 이번 교육은 KAIST와의 업무 협약을 통해 KAIST SW 중심대학 주관 행사로 진행되었으며, AI 개념과 활용에 대한 기초 교육과 체험을 통한 실습 기반 교육으로 진행되었습니다. 씨에스리 이춘식 대표의 '디지털 전환 시대, AI가 답인가?'를 주제로 한 특강에 이어 전혜경 연구소장이 진행하는 '노코드로 배우는 AI 모델' 실습은 씨에스리의 노코드 데이터 분석 솔루션인 BigZami를 이용하여 AI 개발의 원리를 파악하고 실제

Naver Blog

씨에스리-소프트웨이즈, 기업맞춤형 AI 인재양성 위한 업무협약

씨에스리-소프트웨이즈, 기업맞춤형 AI 인재양성 위한 업무협약 발행일 : 2024-09-30 14:31 장재환·박인규 소프트웨이즈 공동대표, 이춘식 씨에스리 이춘식 대표(왼쪽부터)가 전략적 업무협약을 체결했다. 빅데이터·인공지능(AI) 전문기업 씨에스리(대표 이춘식)가 소프트웨어(SW) 실습 환경 서비스 전문기업 소프트웨이즈(대표 박인규·장재환)와 사업 확장 및 AI 인재양성을 위한 협약을 체결했다고 밝혔다. 양사는 이번 협약으로 씨에스리는 데이터 분야에 특화된 기술력과 전문인력 지원에 적극 나설 예정이며, 소프트웨이즈의 실습 교육 플랫폼인 버추얼클래스(Virtual Class)를 통해 더욱 완성도 높은 고객 서비스가 가능해, 버추얼클래스 저변 확대 및 기업 맞춤형 AI 인재를 양성할 수 있을 것으로 기대된다. 이번 협약에 활용되는 소프트웨이즈의 주력서비스 버추얼클래스는 클라우드 기반 영상회의 및 실습환경, 원격 모니터링 등을 제공하는 온라인 강의 플랫폼으로, 브라우저를 통한 실습환

Naver Blog

씨에스리, KAIST와 AI 교육 원데이 클래스 개최

씨에스리, KAIST와 AI 교육 원데이 클래스 개최 발행일 : 2024-09-26 15:20 이춘식 씨에스리 대표가 AI 특강을 진행하고 있다. 씨에스리는 26일 초·중·고 교사 20명을 대상으로 KAIST SW중심대학과 연계해 'AI 교육 원데이클래스(3기)'를 진행했다고 밝혔다. 이번 교육은 KAIST와 업무협약을 통해 KAIST SW중심대학 주관 행사로 진행됐으며, AI 개념과 활용에 대한 기초 교육과 체험을 통한 실습 기반 교육으로 진행됐다. 이춘식 씨에스리 대표의 '디지털전환시대, AI가 답인가?'를 주제로 다룬 특강에 이어 전혜경 연구소장이 진행하는 '노코드로 배우는 AI 모델'을 실습하는 시간을 가졌다. 씨에스리의 노코드 데이터 분석 솔루션인 BigZami를 이용해 AI 개발 원리를 파악하고 실제 데이터분석 모델을 만들고 이해하는 시간으로 진행됐다. 본 교육에 참여하는 교사는 AI 모델 개발과정을 단계별로 파악하고 학습과정을 거쳐 AI 알고리즘을 손쉽게 접근이 가능하고

Naver Blog

[전문가 칼럼] 관계형 데이터 모델링 중 식별자에 대한 이야기

서윤식 1. 데이터 모델링의 정석과 현장의 데이터 모델러 필자는 데이터 모델링 강의도 진행하지만, 현장에서 모델러로서 활동하기도 합니다. 강의할 때 수강생에게 이야기 하는 것은 데이터 모델링의 정석을 이야기 합니다. 그리고 현장에서는 많은 부분 수강생들에게 이야기 한 것과 반대의 모델링을 할 때도 많습니다. 왜 이런 일이 발생할까요? 뭐가 맞는 것일까요? 강의장에서 데이터 모델링의 정석을 이야기 하는 저와 현장에서의 데이터 모델러로서의 저는 다른 사람일까요? 아니면 제가 이중 인격이라는 고차원적 기술을 구사하는 어마무시한 사람일까요? 이와 관련해서 재미있는 경험을 한 적이 있었습니다. 감리사 자격증을 보유하고 계신 분이 수강생으로 들어오신 적이 있었습니다. 그리고 6개월 후 제가 수행하고 있는 프로젝트에 감리 담당자로 만났습니다. 제가 만들어 놓은 모델을 보더니 한 말씀 하시더군요. “강의장에서 말씀 하신 것과 너무 다릅니다. 강의장에서는 이렇게 말씀하지 않으셨잖아요?” 웃으며 한

Naver Blog

뉴스레터 [빅재미 주간소식 2024.9.13]

2024/09 Vol.30 안녕하세요. BigZami입니다. 민족 대명절 추석을 앞두고, 보름달처럼 풍성한 BigZami 뉴스레터가 찾아왔습니다. 오늘은 씨에스리 X 인젠트 업무 협약 체결 소식, 데이터 분석을 해야 하는 이유, 빅재미 사용 매뉴얼을 소개해 드립니다. 빅데이터·인공지능 전문 기업 씨에스리와 데이터 플랫폼 전문 기업 인젠트가 오픈소스 DBMS 구축 사업 및 교육 활성화를 위해 전략적 업무 협약(MOU)을 체결했습니다. 이번 협약을 통해 양사는 인젠트의 오픈소스 통합 DBMS 플랫폼인 eXperDB의 기술 협력 및 판매를 공동으로 추진할 예정입니다. 특히, 씨에스리의 데이터 모델 솔루션인 ERgrin을 활용한 표준화 및 설계를 통해 오픈소스 DBMS 시장에서 더욱 경쟁력 있는 비즈니스 기회를 창출할 것으로 기대됩니다. 씨에스리의 ERgrin은 데이터베이스 모델링과 설계를 위한 전 과정 기능을 제공하며, 인젠트의 eXperDB는 포스트그레SQL 기반으로 다양한 엔터프라

Naver Blog

[전문가 칼럼] 무엇 때문에 '데이터분석'을 해야 하는가?

씨에스리_이춘식 대표이사 우선, 데이터분석을 해야 하는 이유에 대해서 생각해 볼 필요가 있다. 단순한 집계를 위해서 데이터분석을 해야 하는가? 아니면 다른 회사나 기관이 하니까 해야 하는가? 아니면 데이터분석을 통해 남들이 성공했다고 해야 하는가? 그렇지 않으면 요즘 공공 분야는 데이터기반행정을 위해 해야 하는 법, 제도가 있어서 해야하는가? 왜 데이터분석을 해야 할까? 본질적인 질문을 던져서 그에 대한 방향을 도출하는 것은 개인이나 회사가 데이터분석을 제대로 하는 출발점으로 좋은 역할을 할 것이다. 무엇 때문에 데이터분석을 해야 할까? 첫 번째는 데이터의 패턴을 찾아내기 위해 데이터분석을 해야 한다. 여기에서 중요한 점이 그것이 누구나 알 수 있는 뻔한 패턴이라고 할지라도, 데이터가 그것을 정확하게 알려주는 패턴으로 나타나 알 수 있다면 데이터분석을 해야 한다. 누구나 아는 뻔한 패턴이라도 그것이 데이터로부터 나오는 것이 아니라, 사람의 경험 즉 사람지능(Personal AI)에

Naver Blog

씨에스리-인젠트, 오픈소스 통합 DBMS 플랫폼 공급 확대 협력

씨에스리-인젠트, 오픈소스 통합 DBMS 플랫폼 공급 확대 협력 발행일 : 2024-09-09 10:57 <이춘식 씨에스리 대표와 박재범 인젠트 대표(왼쪽 세 번째부터)가오픈소스 DBMS 구축 사업 및 교육 활성화 위한 업무협약을 맺었다.> 빅데이터·인공지능(AI) 전문기업 씨에스리(대표 이춘식)가 데이터 플랫폼 전문기업 인젠트(대표 박재범)와 오픈소스 DBMS 구축 사업 및 교육 활성화를 위해 전략적 업무협약(MOU)을 체결했다고 9일 밝혔다. 양사는 인젠트의 오픈소스 통합 DBMS 플랫폼인 엑스퍼DB(eXperDB)의 기술 협력 및 판매를 함께 한다. 씨에스리의 데이터 모델 솔루션인 'Ergrin'을 통한 표준화 및 설계로 더욱 완성도 높은 고객 서비스가 가능해 오픈소스 DBMS 시장에서 경쟁력 있는 비즈니스 기회가 창출될 것으로 기대된다. Ergrin은 데이터베이스 모델링과 설계를 위한 전 과정의 기능을 제공하며, 공동 모델링 작업·부드러운 UI·모델링 객체 재활용 등을 통해

Naver Blog

[전문가 칼럼] 빅데이터 과제 기획서 만드는 방법

씨에스리_이춘식 대표이사 조직에서 빅데이터 분석을 할 때는 그 것을 수행하기 위한 기획서 작성이 요구된다. 그리고 그 기획서는 주요 이해관계자에게 설득력있는 전달이 되어야 의미있고 잘 작성된 기획서라고 할 수 있다. 이번 본문에서는 빅데이터 기획서를 작성할 때 어떤 관점으로 내용을 작성해야 하는지에 대해서 설명한다. 빅데이터 과제 기획서는 다음과 같은 목차 순으로 작성하도록 한다. 1. 제목 2. 과제개요 2.1 목적 2.2 필요성 2.3 주요내용 3. 활용 데이터 4. 기대효과 및 활용방안 4.1 기대효과 4.2 활용방안 먼저, 제목을 작성할 때는 과정에 대한 내용보다는 목적을 포함한 효과성을 중심으로 제목을 기술하는 것이 좋다. 이를테면, '사용자 사용 이력에 대한 빅데이터 분석 지수 도출' 이렇게 과정을 중심으로 기술하는 경우도 많이 있는데, 이런 부분은 개발자관점의 제목에 해당한다. 이 제목은 사용자의 목적과 효과성에 기반하여 제목을 '시스템 편의상 향상을 위한 사용자접근 최

Naver Blog

뉴스레터 [빅재미 주간소식 2024.9.5]

2024/09 Vol.29 안녕하세요. BigZami입니다. 선선한 바람과 함께 찾아온 9월의 첫 BigZami 뉴스레터로 IT 트렌드 소식을 만나 보세요! 오늘은 빅데이터 과제 기획서 만드는 방법, AI 기반 OCR의 기업 내 활용 및 구축, 재고 데이터 분석 시나리오를 소개해 드립니다. 뉴스레터 구독하기

Naver Blog

재고데이터를 활용한 악성재고 판매여부 예측 및 판매증가 요소 분석

안녕하세요!! 빅재미입니다. 재고 데이터느 재고 종료는 활성재고와 악성재고로 나눌 수 있는데요~ 활성재고는 재고 기간이 짧고 회전율이 높은 자재나 제품을 말하며, 정상 재고량으로 인정되는 것으로서, 활발하게 유동할 수 있는 재고입니다. 악성재고는 수요에 비해 공급이 지나치게 많아서 생기는 재고로, 판매사 입장에선 가장 큰 골칫거리 중 하나인데요!! 오늘은 활성재고와 악성재고의 특징과 재고가치를 분석해 악성재고의 판매여부를 예측하고, 악성재고 분류 등급을 세부화해 판매증가 요소를 분석해보겠습니다~ [기대효과] 재고가치가 높은 악성재고의 판매여부를 예측하고 판매 증가 요인 확인 <전체 워크플로우> 활용 데이터 이번 분석에서 사용할 데이터는 판매물품의 재고 데이터로, 해당 데이터에는 재고타입과 판매, 재고량, 고객 실구매가 등의 데이터가 포함되어 있습니다. - 크기: 198,917행, 14열 - 출처: 캐글 컬럼명 설명 예시 Oder 주문번호 50,94,68 File_Type 재고타입 A

Naver Blog

뉴스레터 [빅재미 주간소식 2024.8.29]

2024/08 Vol.28 안녕하세요. BigZami입니다. 오늘은 BigZami 뉴스레터와 함께 NoSQL 데이터베이스, 클라우드 네이티브 환경 전환 전략 그리고 E-commerce 데이터 분석 시나리오를 읽어 볼까요? 뉴스레터 구독하기

Naver Blog

[전문가 칼럼] NoSQL 데이터베이스

씨에스리_이춘식 대표이사 NoSQL은 기존의 관계형 데이터베이스의 한계를 벗어나 비정형, 초고용량 데이터처리를 위해 쓰기속도에 중점을 둔 다수 서버에 데이터복제 및 분산저장 등 수평적 확장이 가능한 비-관계형 분산 데이터 저장소로 다음과 같은 특징을 가지는 데이터베이스이다. NoSQL의 특징을 종합하면 다음과 같이 나타난다. 특징 설명 대용량 데이터 처리 - 페타바이트 수준의 데이터 처리 수용 가능한 느슨한 데이터 구조 제공 유연한 스키마 사용 - 기 정의된 스키마 없이 데이터를 상대적으로 자유롭게 저장함 - Key-Value 및 Graph, Document 구조의 단순화된 형태로 저장 저렴한 클러스터 구성 - PC 수준의 상용 하드웨어를 활용 다수 서버를 통한 수평적인 확장 및 데이터 복제 및 분산 저장 가능 단순한 CLI 제공 (Call Level Interface) - 기존의 관계형 데이터베이스의 SQL과 같은질의 언어를 제공하지 않음 - 간단한 API Call 또는 HTTP를

Naver Blog

[Tech 리포트] AI 기반 OCR의 기업내 활용 및 구축

안준현 (주)로민 책임연구원 본 원고는 최근 기업들이 AI를 업무에 도입하는 흐름에서 기업들의 OCR 도입 배경과 기존 Rule 기반의 OCR과 AI 기반 OCR의 차이점을 문자 인식 항목관점에서 설명한다. 이후 AI OCR을 기업에서 구축하기 위한 On-Premise 구축절차를 설명하고, 이를 기반으로 한 AI OCR을 도입 및 구축한 기업에서의 사례를 기술하고, 마지막으로 AI OCR의 기업도입 시 업무관점에서의 기대효과와 향후 AI OCR의 연구방향에 대해 설명한다. I. 기업들의 OCR 도입 배경 최근 AI 부각에 따라 AI를 활용한 자동화 영역에 대한 관심이 매우 증가하고 있다. 보통 기업들이 디지털 트랜스포메이션이라는 이름으로 해당 과업들을 추진중이며, 특히나 실제 업무에서의 영역을 자동화하기 위한 RPA(Robotics Process Automation) 사업들이 디지털트랜스포메이션이라는 주제 하에 적극 추진 및 수행되고 있다. 이 중 RPA에서의 핵심적인 자동화 기술인

Naver Blog

E-commerce 데이터 분석: 사용자 접속기록을 이용한 마케팅 전략수립

안녕하세요!! 빅재미입니다. 운영 중인 웹사이트 기록을 추적해보면 여러가지 정보들을 확인할 수 있는데요~ 오늘은 웹사이트에 접속하는 전세계 사용자 로그인 이력을 통해 지역별 접속빈도/체류 등을 분석하고, 이를 바탕으로 사용자 및 지역 특화된 광고 개시와 이벤트 집행 계획을 수립해볼게요 ㅎ.ㅎ [기대효과] - 글로벌 온라인 쇼핑 이벤트 실행을 위한 효율적 전략수립이 가능하다. - 추가수익을 위한 일회성 이벤트로 매출극대화를 위해 사용자의 행동분석을 통해 타겟 지역과 성별/연령을 개인화하여 이벤트를 실행할 수 있다. - 리소스를 어디에 할당할지에 대한 결정이 가능하고, 투자대비효율(ROI)을 극대화 할 수 있다. 활용 데이터 이번 분석에서 사용할 데이터는 2017년 3월 임의의 1주일 동안의 웹사이트 로그인 기록으로, 해당 데이터에는 웹사이트 접속자의 접속일시, 체류시간, 연령, 성별, 구매액 등의 데이터가 포함되어 있습니다. - 크기: 172,838행, 15열 - 출처: 캐글 - 라이

Naver Blog

뉴스레터 [빅재미 주간소식 2024.8.22]

2024/08 Vol.27 안녕하세요. BigZami입니다. 더위가 그친다는 처서(處暑)입니다. 가을을 맞이하며 BigZami 뉴스레터를 읽어 보세요! 오늘은 데이터분석 패러다임 쉬프트에 대한 칼럼과 빠른 개발을 지원하는 K8s와 CI/CD, 스포티파이 상위권 차트 음원 분석 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[전문가 칼럼] 데이터분석 패러다임 쉬프트(A paradigm shift in data analysis)

씨에스리_이춘식 대표이사 수 십년 동안 해왔던 데이터 분석이 최근 10년 동안 다양한 영역에서 급격하게 변화되고 있다. 그 변화가 부정적인 방향의 변화인가 아니면 긍정적인 방향으로의 변화인지를 토론하는 것은 바람직하지 않아 보인다. 다만, 이러한 변화의 바람 속에서 어떻게 이것을 능동적으로 활용할 것인지에 대한 것은 온전히 조직이나 개인의 선택이 문제이다. 그리고 그 선택결과에 따라 가져갈 수 있는 가치(Value)에 차이가 많이나는 것은 수많은 분석을 통해 업무서비스에 반영한 최근 사례들이 그 효과를 대변하고 있다. 최근 10년 동안 데이터 분석의 패러다임은 어떻게 변화되고 있을까? 이 변화를 가치, 주체, 대상, 기술, 과정, 결과의 6가지 측면에서 방향을 정리하면 다음과 같다. 분석 가치인식의 변화: 선택적, 시간과 자원이 있으면 수행, 절대적, 경쟁우위가 아닌 경쟁탈락하지 않으려면 필연적으로 선택해야만 하는 방법으로 변화됨 분석 주체의 변화: 극히 소수(매우 전문적인 사람들)

Naver Blog

뉴스레터 [빅재미 주간소식 2024.8.1]

2024/08 Vol.25 안녕하세요. BigZami입니다. 무덥고 습한 8월의 첫날이에요. ️ BigZami 뉴스레터와 함께 더위를 이겨내 보아요! 오늘은 빅데이터의 특징과 활용에 대한 칼럼과 데이터센터 구축과 운영 트렌드, 서울시 가구전력 사용량 예측 분석 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 공공서비스 환경의 클라우드 네이티브 기반 서비스 구축 방향성

최우슬_(주)아이리포 전 세계는 서비스의 신속성, 안정성, 비용 효율성을 높이기 위해 자체 구축 시스템에서 클라우드 기반의 시스템으로 전환하고 있다. 국/내외 유수의 기업들은 클라우드 네이티브 방식을 채택하여 디지털 혁신을 추진 중이며, 정부도 이러한 추세에 발맞춰 클라우드 네이티브 적용을 핵심 과제로 설정했다. 관련 기관 및 부처에서는 2024년부터 신규 시스템 구축 시 클라우드 네이티브를 우선적으로 고려하도록 하고 있으며, 2026년부터는 클라우드 전환 물량의 상당 부분을 클라우드 네이티브 환경으로 전환할 계획이다. 클라우드 네이티브는 인프라뿐만 아니라 애플리케이션과 아키텍처를 클라우드 기반으로 전환하는 것을 의미하며, 컨테이너, 마이크로서비스, 데브옵스(DevOps), CI/CD 등의 다양한 기술요소를 포함한다. 이러한 기술들을 기반으로 클라우드 환경에서 애플리케이션의 배포와 관리를 용이하게 하고, 다양한 환경에서의 상호 운용성과 이식성을 제공하여 장애로부터 독립적인 환경을 구

Naver Blog

쇼핑몰의 고객 데이터 분석을 통한 고객탈퇴(이탈) 예측

안녕하세요!! 빅재미입니다. 쇼핑몰 고객 정보 클러스터링을 통해 특성을 이해하고, 쇼핑몰 고객 데이터 분석을 통해 통한 고객탈퇴 예측 및 예방에 활용할 수 있는데요~ 이번 분석에서는 아래의 목표를 가지고 시작해보겠습니다 ㅎㅎ ① 이커머스 고객의 특성 요소들을 통해 시각화하고,예상되는 이탈 고객의 사전 파악 및 예방 조치 ② 고객특성을 군집화하여 유사그룹별 특징을 파악 ③ 고객의 이탈 예측을 위한 분류예측모델을 구축하여 이탈징후가 보이는 고객을 식별하고 대응 [기대효과] - 온라인 쇼핑몰의 구매패턴 분석을 통한 고객탈퇴 예측하여 고객이탈 방지에 기여 - 탈퇴 가능성이 있는 고객 대상으로 맞춤형 프로모션 제공하여 재구매 유도 활용 데이터 이번 분석에서 사용할 데이터는 쇼핑몰 고객 데이터로, 고객 개인정보 및 쇼핑정보 등이 포함되어 있습니다. - 크기: 4192행, 25열 - 고객탈퇴 예측 위한 고객 데이터셋 - 출처: Kaggle 컬럼명 설명 예시 CustomerID 고객번호 5001,

Naver Blog

[Tech 리포트] 빠른 개발을 지원하는 K8s와 CI/CD

전창국_(사)한국정보공학기술사회 애자일은 비즈니스 환경에서 민첩한 접근 방식을 강조하여, 능동적인 대응과 적응의 중요성을 강조합니다. K8s와 CI/CD는 현대 소프트웨어 개발에서 필수적인 요소로, 개발 및 운영 효율성을 향상시키고 빠른 시장 진입을 가능하게 합니다. Kubernetes(K8s)는 컨테이너화된 애플리케이션의 효율적인 배포와 관리를 지원하는 오케스트레이션 플랫폼입니다. CI/CD는 지속적인 통합 및 배포를 의미하며, 코드 품질을 유지하고 서비스를 신속하게 출시할 수 있게 해줍니다. 코드 컨테이너화는 애플리케이션 코드를 컨테이너 이미지로 패키징하는 과정을 말합니다. 애플리케이션 컨테이너화의 증가로 Kubernetes(K8s)의 활용성이 더욱 증가하고 있습니다. 이 과정은 개발 및 운영 환경의 일관성을 보장하며, Jib, Kaniko, Ko 등의 도구를 사용하여 쉽게 구현할 수 있습니다. 또한, CI/CD 파이프라인 구축에 활용되는 GitLab, GitLab Runner,

Naver Blog

[전문가 칼럼] 관계형DB를 위한 데이터모델과 NoSQL DB를 위한 데이터모델 특징

씨에스리_이춘식 대표이사 관계형 데이터베이스는 정규화에 기반하여 어플리케이션 독립적으로 설계하여 데이터베이스를 생성하고, NoSQL 데이터베이스는 어플리케이션에 처리하고자 하는 내용에 기반하여 정규화 이후 반정규화를 하여 데이터베이스를 생성한다. 어떤 DBMS를 사용하는지에 따라서 데이터모델을 다르게 설계해야 하기 때문에 이에 대한 이해가 중요하다. 관계형 데이터베이스는 가장 중요한 특징은 ACID(원자성, 일관성, 독립성, 지속성)을 유지하는 것을 목표로 설계를 하게 된다. 이에 따라 데이터를 쓰고, 수정하고, 삭제하는데 있어서 일관성 있게 하기 위한 설계와 관련된 DBMS 기술이 매우 중요한 특징을 가지고 있다. 방식 관계형 DB 데이터 모델링 NoSQL 데이터모델링 개념도 핵심 - ACID기반 데이터모델링-Atomicity, Consistency, Isolation, Durability - BASE 기반 데이터 모델링 - Basically Available Soft-State

Naver Blog

스포티파이 상위권 차트 음원 분석

안녕하세요!! 빅재미입니다. 전 세계의 음악시장을 이끄는 주된 요인 중 하나가 바로 음원 스트리밍 서비스인데요. 과거에는 음반판매와 다운로드 서비스가 주를 이루었지만, 현재는 스포티파이, 유튜브 뮤직, 애플 뮤직 등 전체 음악시장에서 스트리밍이 차지하는 비중이 급속도로 늘어나는 중입니다. 그 중에서도 오늘은 2023년 스포티파이 상위 차트 음원 데이터를 활용하여 인기 있는 음악의 특징을 분석하고 비슷한 속성을 가진 음악을 군집화하여 노래 리스트를 도출해보겠습니다~! [기대효과] - 유사한 음악 특성을 가진 곡들을 그룹화하여 음악 추천에 활용 가능 활용 데이터 이번 분석에서 사용할 데이터는 스포티파이의 2023년 상위 차트 음원 데이터로, 음원 정보와 속성, 차트순위 등이 포함되어 있습니다. - 크기: 953행, 24열 - 스포티파이의 2023년 상위 차트 음원 데이터 - 출처: kaggle 컬럼명 설명 예시 track_name 노래 제목 LALA, vampire artist_s__n

Naver Blog

뉴스레터 [빅재미 주간소식 2024.8.14]

2024/08 Vol.26 안녕하세요. BigZami입니다. 입추가 지났지만 여전히 더운 8월 중순입니다. BigZami 뉴스레터와 함께 처서 매직을 기다려 볼까요? 오늘은 DB 데이터 모델에 대한 칼럼과 공공서비스 환경의 클라우드 네이티브, 쇼핑몰 데이터 분석을 통한 고객 탈퇴 예측 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 기업의 전산실 환경에서 클라우드 네이티브 환경 전환전략

박진산_컴퓨터시스템응용기술사 클라우드 네이티브 환경이 대중화되었지만, 아직도 많은 기업에서 조직 문화와 기술저항 등으로 인해 전산실 환경에서 클라우드 환경의 전환이 지연되고 있다. Rehosting, Replaforming, Rewriting과 같은 클라우드 네이티브 전환 전략을 단계적으로 수립하여 서비스 중요도에 따라 클라우드 네이티브를 전환 할 수 있을 것이다. 본 고에서는 기존 전산실 환경의 한계와 클라우드 네이티브 환경 전환의 이점에 대해 알아보고, 이를 기반으로 성공적인 클라우드 네이티브 환경으로 전환을 위한 4가지 전환전략을 제시하고자 한다. I. 전산실 환경의 한계 및 클라우드 네이티브 환경의 등장 클라우드 서비스의 등장과 발전으로 많은 인프라 환경이 클라우드 환경으로 전환되었지만, 대기업과 제조업 등 안정성을 중시하는 기업은 아직도 많은 기업이 전산실 환경(On-premise) 환경을 사용하고 있다. 전산실 환경에서 클라우드 전환을 하지 못하는 주요 원인으로는 첫 번째

Naver Blog

[전문가 칼럼] 빅데이터의 특징과 활용

씨에스리_이춘식 대표이사 빅데이터는 일반적으로 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터를 의미하는 것으로 출발했다. 일반적인 데이터에 빅(Big)이라는 수식어를 붙여서 일부러 빅데이터로 구분하는 이유는 다음과 같았다. 1) 일반적인 데이터처리 양을 훨씬 뛰어 넘는다 → 데이터양이 훨씬 많을 수 있다. 2) 일반적인 데이터의 형식보다 훨씬 다양한 데이터를 처리한다 → 데이터의 길이, 형식을 제한하지 않는다. 3) 기존에 일반적인 데이터처리의 속도를 훨씬 뛰어넘는다 → 대량에 데이터를 빠른 속도로 처리한다. 이 세 가지를 가트너에서는 3V 특징으로 정리하였다. 3V 구분 의미 빅데이터 Volume 데이터의 규모 - 수십TB ~ 수십 PB [페타바이트] Velocity 데이터 수집, 처리 속도 - 대량 데이터의 실시간(Real Time) 또는 거의 실시간(Near Real Time) 처리 Various 데이터형식(유형, 길이) - Legacy

Naver Blog

[Tech 리포트] 하이퍼스케일 데이터센터 구축/운영 트랜드

함윤식_101회_정보관리기술사 데이터센터는 클라우드, 인공지능(AI), 빅데이터, 사물인터넷(IoT) 등 신기술 확대로 인한 대용량의 데이터를 관리하는 데 필수적인 인프라로 꼽힌다. 세계적으로 아마존, 마이크로소프트(MS), 구글 등 글로벌 클라우드 기업 주도로 대규모의 하이퍼스케일 데이터센터가 크게 확산되고 있다. 그래서 기존 기업고객의 저전력 장비를 유치하던 데이터센터의 구축 및 운영 트랜드가 고전력 장비를 지원하기 위해 크게 변화하고 있다. 이에 현재 데이터센터의 현황과 전망, 관련 인증과 지표, 전자파 이슈 등 관련 현황과 구축 트랜드 및 시사점을 정리하였다. I. 하이퍼스케일 데이터센터 개요 1. 데이터 센터의 개념 데이터센터(Data Center)는 서버 컴퓨터와 네트워크 회선 등을 제공하는 건물이나 시설을 말한다. 비유하자면 서버를 세입자로 받는 건물이라고 생각하면 된다. 데이터센터는 인터넷의 보급과 함께 폭발적으로 성장해 왔다. 인터넷 검색, 쇼핑, 게임, 교육 등 방

Naver Blog

서울시 가구전력 사용량 예측(데이터 시각화, ARIMA 모델예측)

안녕하세요!! 빅재미입니다. 최근 전 세계적으로 기후변화에 따른 이상기후 현상이 빈번하게 발생하면서, 여름철 폭염으로 에어컨 사용이 급증해 전력소비가 평소보다 늘어나고 있는데요~ 전력수급이 수요를 따라가지 못하면 전력부족상태로 인해 급작스런 정전 등 비상사태가 발생하는 위험을 초래할 수 있습니다. 하지만, 미리 전력사용량을 예측하고 분석하면 대응하기 수월하고 예방할 수도 있겠죠? 이번 포스팅에서는 시각화를 통해 서울시 구별 전력 사용량을 비교하고 ARIMA 모델 기반의 전력 사용량을 예측해보겠습니다^^ [기대효과] - 향후 일정 기간 동안의 전력 수요를 예측하여 전력 수급 계획을 세우고 전력 생산 및 배분을 효율적으로 조정하는 등 전력 수급 계획을 수립하는 데에 활용함 - 전력 사용량 패턴을 파악하여 에너지 절약 정책 수립에 활용함 활용 데이터 이번 분석에서 사용할 데이터는 서울시 가구전력 데이터와 서울시 월별 날씨 데이터입니다. [데이터 1] 서울시 가구전력 데이터 - 크기: 1,

Naver Blog

뉴스레터 [빅재미 주간소식 2024.7.25]

2024/07 Vol.24 안녕하세요. BigZami입니다. 비가 쏟아지고 있는 7월 말입니다. 빗길 보행 조심하시고, 안전 운전하세요! 오늘은 데이터 과학에 대한 칼럼과 성공적인 SaaS 전환 전략, 서울시 전기자동차 충전소 이용 현황 분석 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[전문가 칼럼] 데이터 과학과 데이터 과학자

씨에스리_이춘식 대표이사 ’데이터과학(Data Science)‘은 데이터(Data) + 과학(Science)의 결합체에 해당한다. [그림1] 데이터과학 데이터는 곧 사실(Fact)로 대변하는 자연과 인간의 문명 속에 발생되는 것들을 일정한 표기법인 문자, 숫자, 사진, 영상 등으로 표현한 것을 의미하고, 과학(Science)은 진리나 법칙 발견을 목적으로 일정한 가정과 가설을 수립하여 입증할 수 있고 객관적인 방식에 의해 증명하고 할 수 있는 것을 의미한다. 두 가지의 의미를 결합하여 데이터과학은 사실을 대변하는 현상에 대해 수많은 데이터를 기반으로 객관적이고 증명 가능한 상태로 만들어내는 것이라고 정의할 수 있다. 데이터과학은 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합 분야다. 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으

Naver Blog

[Tech 리포트] 성공적인 SaaS 전환 전략

오슬아PE_아이리포기술사회 디지털플랫폼정부 주도 하에 국내 구축형·패키지 SW기업의 SaaS(Software as a Service) 전환이 활발하게 전개되고 있다. 글로벌 클라우드 시장의 흐름과 비슷하게 국내 클라우드 서비스 공급기업 중 SaaS 기업 수는 어느덧 60%가 넘는 규모에 도달했다. 정부는 2026년까지 SaaS 기업을 1만 개 달성한다는 목표까지 내세웠다. 그러나 SW의 SaaS화를 단순히 기술적인 변화로만 접근하는 것은 곤란하다. 비즈니스 이해가 바탕이 된 SaaS화가 이루어졌을 때 비로소 성공적인 고객 맞춤형 서비스의 제공을 가능케 한다. 본 고에서는 SaaS 전환을 위한 기술과 방법을 정리해보고 각 기업에서 기존 SW를 SaaS로 전환하기 위해 고려해야 할 사항을 제시해보고자 한다. I. 서론 정보통신산업진흥원(NIPA)에서 발표한 ‘2022년 클라우드 산업 실태조사’에 따르면 2021년도 국내 클라우드 서비스 공급기업 중 SaaS 기업 수는 1,102개(62.

Naver Blog

서울시 전기자동차 충전소 이용 현황 분석(데이터 시각화)

안녕하세요!! 빅재미입니다. 전기차 사용량이 증가하면서 전기차 충전소가 곳곳에 생겨나고 있는데요! 오늘은 전기자동차 충전소 정보 및 사용량 데이터를 분석하여 충전소 이용 현황 파악하고, 서울시 내 행정구역별 충전소 수요 시각화 및 충전소 증설 필요 지역 탐색해보겠습니다 ㅎㅎ [기대효과] 현존하는 전기차 충전소의 위치와 제원을 파악함으로써 효율적인 운영 및 유지보수가 가능. 충전소 현황 데이터와 충전소 사용량 데이터를 이용하여 충전소 증설이 필요한 지역 도출 전기차 충전소 증설 시 고려해야 할 요소에 대한 분석 가능(설치 시설의 유형, 충전기 용량 등) 활용 데이터 이번 분석에서 사용할 데이터 2가지로, 전국 충전소 현황 데이터와 서울시 전기차 충전소 충전량 데이터입니다. [데이터 1] 전국 충전소 현황 데이터 - 크기: 89,327 행, 21 열 - 전국 충전소 설치 현황 및 정보 - 출처: 환경 빅데이터 플랫폼 (https://www.bigdata-environment.kr/use

Naver Blog

[전문가 칼럼] 생성형 AI로부터 데이터를 식별해 분석·활용할 수 있는 방법

AI에 대한 기술의 진보가 매우 빨라졌지만, 모든 데이터를 생성형 AI에 그대로 학습하여 결론까지 우리가 원하는대로 분석 해 낼 수 있기 까지는 상당한 시간이 걸릴 것 것으로 예상된다. 생성형 AI가 제공할 수 있는 장점과 전문적인 데이터분석 기술을 결합하면 더 창의적으로 데이터분석을 할 수 있고, 그 동안 막혀 있던 데이터수집의 원천데이터 영역이나 데이터수집에 소요되는 많은 비용을 최소한으로 줄여주는 새로운 방식의 데이터수집을 생각해 볼 수 있을 것 같다. 다음은 탁구경기를 하고 있는 사진을 생성형AI로 분석한 결과이다. 클러드(Claude)와 챗GPT(ChatGPT)를 통해 분석을 진행해 보았는데, 클러드가 좀 더 자세하게 분석결과를 제시했다. 그 내용을 제시하면 다음과 같다. <탁구를 하는 모습> 요청 > 뭐 하는 사진인지 분석해줘? 답변 > 1. 이 사진은 탁구를 치고 있는 여성을 보여주고 있습니다. 주요 특징은 다음과 같습니다: 여성은 핑크색과 네이비 블루가 섞인 운동복을

Naver Blog

뉴스레터 [빅재미 주간소식 2024.7.19]

2024/07 Vol.23 안녕하세요. BigZami입니다. 본격적인 장마가 시작되었습니다. 궂은 날씨 우산 잘 챙기시고 빗길 조심하세요! 이번 회차에서는 생성형 AI를 활용한 창의적 데이터 분석과 그에 따른 보안 위협과 대응 방안, 그리고 수도권 관광지 만족도 분석 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 생성형 AI 보안 위협과 대응방안

전경화_(주)LG CNS_책임 소싯적에 누군가는 이런 엉뚱한 생각을 해 봤을 것이다. ‘나 대신 글짓기 숙제를 해주는’ 또는 ‘말만 하면 보고서가 만들어지는’ 또는 ‘내 눈에 안 보이는 소스 코드 결함, 빨리 찾고 자동으로 고쳐주는’ 또는 ‘여러 논문의 핵심을 요약해주는’ 그런 시대가 언젠가 온다면 가급적 빨리 왔으면 하는 생각 말이다. 생성형 AI가 드디어 우리의 소원을 들어줄 수 있는 시대가 되었다. 챗GPT의 출시를 기점으로 생성형 AI의 혁신적인 기능이 주목을 받고 있지만, 그에 따른 부작용과 다양한 보안 이슈도 동시에 발생한다. 생성형 AI 기술을 활용한 피싱 메일 생성, 금전적 이득이나 개인정보 유출 등의 목적으로 진짜와 유사한 가짜 웹 사이트를 생성하고, 공개된 생성형 AI의 API를 통해 정보유출을 시도하는 등 생성형 AI는 기대와 반하하는 우려를 동시에 갖고 있다. 생성형 AI가 잘못된 정보를 생성하거나, 악의적으로 AI 모델을 이용하여 생성한 코드를 기반으로 가짜

Naver Blog

관광 데이터 분석 : 수도권 관광지 만족도 분석

안녕하세요!! 빅재미입니다. 여름이 다가오면서 다들 휴가계획 짜고계시지 않으신가요? 수도권 관광지를 방문한 여행객의 여행 타입을 분석하고, 만족도가 높은 지역의 특징을 분석해볼텐데요~ 같이 가보시죠!! [기대효과] 방문객들의 방문지별 만족도를 파악하여 어떤 타겟층이 가장 만족도가 높은지, 어떤 측면에서 만족도가 높은지 등을 파악하여 특정 타겟층에 특화된 프로모션을 제공하거나 만족도가 낮은 측면을 개선하는 방안을 모색할 수 있음 어떤 요소가 방문객들의 경험을 향상시키는지, 어떤 측면에서 가장 만족하는 지 등을 파악하여 관광지에서 제공하는 서비스나 환경을 개선하여 지역에 특화된 관광 서비스 개선 가능 전체 분석 워크플로우 활용 데이터 이번 분석에서 사용할 데이터는 수도권 여행지 관광 데이로, 방문지 정보/여행객 정보/여행 정보 등이 포함되어 있습니다. 16개의 데이터 셋 중에서 여행객 Master, 방문지 정보, 여행, 시군구 데이터 셋을 사용하여 사전 전처리를 수행했습니다. - 크기:

Naver Blog

뉴스레터 [빅재미 주간소식 2024.7.11]

2024/07 Vol.22 안녕하세요. BigZami입니다. 무더운 날씨에 지치지 않도록 건강에 유의하세요! 이번 회차에서는 디자인 씽킹에 기반한 성공 전략과, 새로운 보안 모델 제로 트러스트, 온라인 광고 유입 예측 분석 시나리오를 소개합니다! 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 교육기관 생성형 AI 활용 사례 및 주의사항

박재웅_국가과학기술인력개발원 부연구위원 최근 생성형 AI 기술이 교육 분야에서 개인 맞춤형 학습, 교사 생산성 향상, 스마트 콘텐츠 생성 등에서 활발히 활용되고 있습니다. 교육의 효율성을 높이고 학생들의 창의성을 개발하는 도구로서 학습 및 교육의 질 향상에 크게 기여하고 있습니다. 하지만 생성형 AI는 가짜 뉴스나 환각 현상 등과 같은 가볍지 않은 문제점을 가지고 있습니다. 해당 기고문에서는 교육 또는 교육기관에서 생성형 AI를 어떻게 활용하고 있는지에 대한 실제 사례와 교육 부분에서 활용 시 주의해야 할 사항들을 살펴보도록 하겠습니다. I. 전 세계를 뒤흔든 생성형 AI 열풍 2022년 11월, 인공지능 개발회사인 OpenAI가 ChatGPT를 출시하였을 때 이 생성형 AI가 앞으로 전 세계에 미칠 영향력과 파급력을 예측한 사람은 아주 소수에 불과하였을 것입니다. ChatGPT가 세상에 나온 지 약 1년이 지난 지금 생성형 AI는 현재도 글로벌 열풍을 일으키고 있고 우리 생활 속에

Naver Blog

금융 데이터 분석 : 신용카드 결제 정보를 활용한 사기거래 예측

안녕하세요!! 빅재미입니다. 신용카드 정보가 유출되거나 복제돼서 피해가 속출하고 있다는 이야기를 한 번 정도는 들어봤을텐데요!! 많은 카드사들이 신용 데이터를 활용한 사기 거래로 인한 고객 클레임 및 고객 탈퇴 등을 미연에 방지하고자 하는 노력을 하고 있습니다. 로지스틱 회귀분석이나 Binary Classification이 가능한 알고리즘들을 통해, 신용카드 결제 정보를 활용하여 정당한 거래인지 여부를 예측해볼까요? [기대효과] 최근 빈발하고 있는 신용카드 복제를 통한 금융범죄를 예방하고, 사기거래를 시스템이 선제적으로 탐지하여 인적 비용을 줄일 수 있음 활용 데이터 이번 분석에서 사용할 데이터는 신용카드 결제정보로, 해당 데이터에는 카드 거래가 발생한 곳의 위치, 매체 사용 여부를 식별하여 사기 거래를 판별할 수 있는 데이터가 포함되어 있습니다. - 크기: 1,000,000행, 8열 - 출처: Kaggle - 라이센스: Public Domain 컬럼명 설명 예시 distance_f

Naver Blog

[전문가 칼럼] 생존자 편향(Survivorship bias) 오류의 중요성과 데이터분석

조던 엘렌버그의 '틀리지 않는 법 : 수학적 사고의 힘'에서 기술되어 있는 '생존자 편향(Survivorship bias)'에 대한 내용은 세계 2차 세계대전으로 거슬러 올라가 설명을 해야한다. 2차 세계대전 중 전시학 활동의 중추 기밀조직인 통계연구그룹(SRG)은 미 해군에서 전투기의 생존율을 높이기 위해 장갑을 보강할 목적으로 작전 중 피격된 항공기의 피탄분포를 조사했다. 그리고 그 조사를 진행한 사람들은 "총알을 많이 맞는 비행기 부위를 보강한다면 비행기와 조종사가 살아서 돌아올 확률을 높일 수 있을 것" 이라고 이야기 했다. 하지만, 수학자인 아브라함 발드의 생각은 달랐다. 오히려 "총알의 흔적이 없는 엔진을 보강해야 한다"고 의견을 타나냈다. 그 이유는, 살아서 돌아오지 못한 비행기에는 엔진 쪽에 많은 총탄의 흔적이 있을 것이며, 살아 돌아오지 못했기 때문에 수집된 데이터 통계에는 계산이 되지 않았을 뿐이라고 주장했다. 즉, 살아 돌아온 비행기에서 발생한 데이터만을 대상으로

Naver Blog

뉴스레터 [빅재미 주간소식 2024.7.4]

2024/07 Vol.21 안녕하세요. BigZami입니다. 7월과 함께 본격적인 장마가 찾아왔습니다. 이번 회차에서는 분석 과정에서 주의해야 할 '생존자 편향' 오류와 개인 맞춤형 학습 등 교육 분야에서 활발히 활용되고 있는 생성형 AI, 신용카드 결제 정보를 활용한 사기거래 예측 분석 시나리오를 소개해 드리겠습니다! 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 제로트러스트 보안(Zero Trust Security)

유승연_아이리포기술사회_정보관리기술사 최근 모바일·사물 인터넷 기기의 보급 확산과 클라우드 기반의 재택·원격 근무의 활성화로 언제 어디서든 네트워크에 접속해 업무시스템을 활용할 수 있는 환경이 조성되고 있다. 이에 따라 전통적인 보안 접근 방식인 경계 보안(Perimeter Security)으로는 기업망 내·외부의 경계가 모호해지는 현실에서의 진화되어 가는 공격에 대응하는 것이 점점 어려워지고 있는 실정이다. 이러한 환경에 대응할 수 있는 새로운 보안 모델로 제로 트러스트(Zero Trust)가 각광을 받고 있으며 단순히 보안 솔루션의 교체 또는 도입이 아닌, 새로운 보안 패러다임의 전환, 보안 생태계의 확장이 진행되고 있다. 이에 본 고에서는 제로트러스트 보안의 등장 배경과 필요성, 제로트러스트 보안 아키텍처 및 주요 기술요소를 살펴보고 각국의 정부 및 관련 기업에서의 기술 도입 현황과 도입 추진 시 고려사항을 살펴보고자 한다. I. 서론 최근 다양한 기술의 발전으로 인해 비즈니스

Naver Blog

E-commerce 데이터 분석 : 온라인 광고 유입 예측

안녕하세요!! 빅재미입니다. 온라인 마케팅은 인터넷을 통해 많은 사람들에게 접근하기 쉽고, 기타 광고에 비해 비용이 저렴하기 떄문에 많이 사용되고 있습니다~ 또한, 고객의 행동패턴과 관심사를 분석해 고객 맞춤형 광고를 제공하고 있는데요! 온라인 광고를 진행할 때 고객 특성에 맞게 광고를 조절한다면, 기업의 경쟁령을 강화시킬 수 있겠죠? 오늘은 웹사이트 사용자의 특성을 파악하고 광고 배너 클릭 여부를 예측하는 모델을 학습하여 예측 결과를 비교해볼게요 [기대효과] - 클릭 가능성이 높은 사용자의 특성 및 행동 패턴을 파악하여 마케팅 전략을 개선하는데 활용함 - 클릭 가능성이 높은 사용자에게 노출되는 광고의 비율을 높이고, 클릭 가능성이 낮은 사용자에게는 노출하지 않는 등의 광고 효율성 향상 가능 활용 데이터 이번 분석에서 사용할 데이터는 웹사이트 사용자 정보로, 해당 데이터에는 웹사이트 내에 있는 광고 배너를 클릭 혹은 클릭하지 않고 사이트를 종료한 사용자의 정보와 시간 등을 포함한 가

Naver Blog

[전문가 칼럼] 인간의 욕구와 돈의 관계 - 디자인 씽킹(Design thinking) 5단계

사람의 욕구(필요)를 알아낼 수 있다면 돈을 버는 것은 어려운 일이 아니다 애플 창업자 스티브 잡스가 했던 여러 유명한 이야기 중에는 ‘대다수의 사람들은 원하는 것을 보여주기 전까지는 자신이 무엇을 원하는지 모른다’ 라는 이야기가 있다. 애플의 스마트폰 제품의 특징인 부드러움, 투명성, 비물질적인 감각, 단순성, 사용용이성 등은 제품출시 때부터 지금까지 사람들이 제품에 열광하는 특징으로서, ‘사용자 경험(User eXperience)’의 키워드를 제품이나 서비스개발의 핵심요소로 유행시킨 장본인일 정도로 파급력이 대단했다. 애플은 스마트폰 시장에서의 절대강자이면서 어마어마한 기업가치와 부를 창출했고, 지금도 그 위치를 유지하고 있는 것은 누구도 부인하지 못할 사실이다. 위에서 스티브 잡스가 언급한 내용이 실제로 사실이라면, 사람들의 의견을 듣는 것만으로는 혁신적이고 창의적이고 괜찮은 무엇인가를 만들어내는 것은 어려운 일이라고 할 수 있다. 사람들의 의견을 알아낼 때 설문조사 기법이 제

Naver Blog

뉴스레터 [빅재미 주간소식 2024.6.13]

2024/06 Vol.18 2024년 6월 2주차 BigZami 소식 안녕하세요. BigZami입니다. 이번 회차에서는 데이터의 본질적 의미, 생성형 AI에 관련된 칼럼과 BigZami 분석 시나리오를 소개해 드립니다! 1. 전문가 칼럼ㅣ데이터란 무엇인가? 2. Tech 리포트ㅣ생성형 AI 서비스 활용 3. 분석 시나리오ㅣ카페 배달 매출과 날씨의 상관관계 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 누구나 현자를 보유한다 'GPTs'

전창국_(사)한국정보공학기술사회 GPT는 딥러닝 아키텍처 기술로, 대량의 데이터 학습을 통해 사용자의 요구에 맥락을 이해하고 답변을 제공하는 기능을 갖추었습니다. 각 버전마다 더 많은 데이터를 학습하여 정확하고 다양한 답변을 제공하는 모델로 발전해왔으며, GPTs라는 맞춤형 GPT가 출시되었습니다. 이로 인해 앱스토어 스마트폰 혁명을 뛰어넘는 AI 혁명 시대가 열릴 것으로 기대됩니다. 이제 개인은 평생학습의 환경 속에서 전문적인 지식과 아이디어에 쉽게 접근할 수 있게 되었습니다. 상상력, 융합화, 차별화의 관점으로 GPTs가 제공하는 기회를 적극적으로 활용하여 자신의 기회로 만들어야 하는 시점입니다. I. 생성형 AI 기술의 이해 미국 시사 주간지 Time은 앱, 인공지능, 미용, 로봇 등 21개 부문에서 200개 제품을 선정하여 '올해의 최고 발명품'을 발표했습니다. 그 중에서도 GPT-4는 AI 부문에서 Game-changing AI로 소개되어 '판도를 바꾸는 챗봇'으로 평가되었

Naver Blog

[전문가 칼럼] 학습기반과 규칙기반의 차이점

영어로 'Learning Based~'의 개념은 한국어로 학습기반이고 'Rule Based~'는 규칙기반이라고 번역할 수 있다. 지금까지의 컴퓨팅 방식의 발전은 학습을 기반으로 발전하지 않고 규칙을 기반으로 발전해왔다고 할 수 있다. 규칙기반의 정확한 의미는 일정한 법칙을 사람이 정의하고 그 규칙을 컴퓨터가 해석하여 적용하는 것을 의미하는 것으로 대표적인 문법이 '만약 OOO하다면, 무엇을 해라'라고 하는 법칙에 해당한다. 이 것을 영어로 하면 'IF P-Name is 'CHOLSU' THEN SALARY = 4,000,000'과 같은 규칙을 사람이 생각한 사항을 컴퓨터가 해석하여 실행하도록 일을 주는 방식이다. 사람은 컴퓨터가 수행할 개별 규칙을 만들고 컴퓨터는 그 명령어에 따라 충실하게 실행되는 구조가 규칙을 기반으로한 컴퓨팅 방식으로 이야기 할 수 있다. 학습기반의 방식은 이와는 다르게 접근하는 방식이다. 사람이 규칙을 직접 입력하는 것보다 다양한 사례가 들어오면 그 사례를 바

Naver Blog

금융 데이터 분석 : 신용/개인정보를 기반으로 한 고객 클러스터링

안녕하세요!! 빅재미입니다. 신용카드사에서는 고객의 데이터를 아주 방대하게 가지고 있는데요, 특히 고객들의 소비형태 등 여러 요인들에 따라 신용점수가 오르고 내리곤 하죠~ 이번 컨텐츠에서는 신용 점수 데이터셋을 분석하여 고객 신용도 및 세분화에 대한 통찰력 얻고, 클러스터링(K-Means) 알고리즘을 사용하여 신용도 별 그룹을 예측해보겠습니다!! [기대효과] - 신용카드 사용자를 대상으로 한 타깃 마케팅, 고객분석을 통한 프로파일링을 할 수 있으며, 데이터를 보강할 경우 신용 부도율 예측을 수행 할 수 있음 데이터 분석부터 시각화까지 함께 하러 가보시죠~ 활용 데이터 이번 분석에서 사용할 데이터는 신용점수 데이터로, 해당 데이터에는 데이터에는 납부 내역, 신용 활용률, 신용 계좌 수, 교육 수준, 고용 상태 등 신용 점수에 영향을 미치는 다양한 요소에 대한 정보가 포함되어 있습니다. - 크기: 1,000행, 12열 - 신용점수 데이터셋 컬럼명 설명 예시 Age 나이 20, 35, 4

Naver Blog

뉴스레터 [빅재미 주간소식 2024.6.20]

2024/06 Vol.19 2024년 6월 3주차 BigZami 소식 안녕하세요. BigZami입니다. 기존에 없던 혁신 기술로 우리의 삶을 변화시키고 모든 분야에서 활발히 사용되고 있는 Chat-GPT. 오늘날의 Chat-GPT가 탄생하기까지 인공지능의 학습 방식은 어떻게 변화해왔고, 앞으로 AI가 만들어갈 미래는 어떤 모습일지 알아보겠습니다. 이번 회차에서는 학습기반과 규칙기반의 차이점, 개인형 GPT 'GPTs'에 대한 칼럼을 소개해드리겠습니다. 뉴스레터 구독하기

Naver Blog

[Tech 리포트] No-Code 플랫폼을 이용한 데이터 분석 동향(BigZami, Tableau, Power BI, 오렌지3)

박진만_정보관리기술사 Data Driven 경영환경 구성은 디지털 트랜스포메이션을 통해 경영혁신 전략 수립 및 실행을 위한 기업의 핵심역량이다. 신속한 데이터 분석 및 의사결정을 위한 경영환경 구성은 누구나 쉽게 데이터를 이용하여 다양한 데이터를 수집/분석으로 결과를 도출하여 객관적이고 신속한 의사결정을 도출 할 수 있는 것이 핵심 성공요소(KSF: Key Success Fator)이며, 이러한 환경 구성을 위해 전통적인 솔루션 개발/구축이 아닌 개발 비전공자도 쉽게 사용할 수 있는 노-코드 플랫폼이 부각되고 있다. 본 리포트에서는 데이터 분석을 위한 노-코드 플랫폼 동향과 기업에서 도입 시 고려사항에 대해 설명한다. I. 디지털 트랜스포메이션과 노코드 플랫폼 기업은 디지털 트랜스포메이션(DX) 위해 "Data-Driven" 기반 다양한 지표를 신속하게 분석하고 의사결정을 지원하는 구조가 필요하며[1], 많은 기업에서 이를 위해 투자하고 주목하는 것이 노-코드(No-Code) 플랫폼

Naver Blog

[전문가 칼럼] IT를 활용한 변화는 어디로 향하고 있는가?

IT(Information Technology)는 제3차 산업혁명의 중심에서 정보화 시대라는 타이틀로서 지금까지 많은 역할을 수행했다. 미국의 디지털혁명을 주장했던 앨린 토플러는 1960년대 중반에 ‘미래의 충격’이라는 책을 통해 변화에 대한 인류의 적응과 관련된 내용을 언급했고, 1980년 ‘제3의 물결’이라는 책은 인류가 발전하는 에너지를 세 가지로 구분 ‘1. 기술체계, 2. 사회 체계, 3. 정보체계’ 하여 그중 정보체계가 반드시 올 것이며, 이 변화는 매우 급진적이고 혁명적인 변화가 될 것이라는 내용을 제시했고 이는 수많은 사람들에게 당시에 충격적인 내용으로 다가왔었다. 실질적으로 제3의 물결에서 언급한 대로 정보는 이후에 마이크로 소프트, 아이비엠, 애플컴퓨터, 페이스북, 구글, SAP 등 수 많은 정보를 중심으로 회사와 더불어 사회가 급격하게 변화되는데 중심에 있었다. 제3의 물결은 권력의 이동까지도 언급했는데, 전 세계에서 실질적인 권력을 정보를 갖은 회사나 국가는 정

Naver Blog

뉴스레터 [빅재미 주간소식 2024.6.27]

2024/06 Vol.20 안녕하세요. BigZami입니다. 이번 회차에서는 3차 산업혁명에서 4차 산업혁명에 이르기까지 IT기술에 기반한 변화의 흐름과 코딩 역량에 상관없이 분석의 확산을 가능하게 해준 노-코드 플랫폼에 대한 칼럼을 소개해 드리겠습니다. 뉴스레터 구독하기

Naver Blog

유통 데이터 분석 : 카페 배달매출과 날씨 상관관계 분석

안녕하세요!! 빅재미입니다. 거리를 걷다보면 한 블럭 내에도 카페가 많은 것을 볼수 있는데요~ 그만큼 한국인들의 커피와 음료 소비가 높다는 뜻이기도 합니다. 게다가 배달업이 발달하면서, 음료를를 오프라인으로 직접 사지않고 주문해서 마시는 경우가 많아졌습니다. 그런데 날씨에 따라서 카페 매출의 양상이 다른걸 알고 계신가요? 지금부터 카페의 배달 매출과 날씨 데이터와의 비교를 통해서 비오는날, 바람부는날, 추운날의 배달매출에 미치는 영향을 분석해 배달매출-날씨의 상관관계를 분석해보겠습니다!! [기대효과] - 카페의 음료 및 푸드의 배달매출이 기온, 강수량, 풍속에 따른 변화추이를 분석하여, 날씨에 따른 매출량을 예측한다. 활용 데이터 이번에 사용할 데이터는 2가지로, 배달의민족의 2021년 배달매출 데이터와 2021년 날씨 공공데이터입니다. [데이터 1] 배달의 민족 2021년 카페배달 매출금액 첨부파일 03카페배달매출데이터_2021.xlsx 파일 다운로드 컬럼명 설명 예시 주문일자 주

Naver Blog

[Tech 리포트] 생성형 AI 서비스 활용

신창원_기술사 2016년 알파고가 세계 바둑 챔피언을 이긴지 불과 10년도 지나지 안은 현재 인공지능(AI)은 우리의 일상의 많은 부분에 스며들었습니다. 챗봇, 스마트폰, 자율주행 차량의 기능 및 소비자 만족을 위해 사용하는 도구에 이르기까지 모든 것에 영향을 미치고 있습니다. 이러한 인공지능의 발전은 클라우드 컴퓨팅, 빅데이터, 다양한 학습모 의 발달로 그 성능을 가늠하기 어려울정도로 발전을 하였습니다. 최근 Open AI사에서 발표한 chatGPT는 또한번 사람들의 관심을 끌었고 이러한 생성형AI는 여러분야에서 활용이 가능하여 전세계인들의 관심을 사라잡고 있습니다. 누구나 이를 활용하여 새로운 컨텐츠를 생성할 수 있고 업무나 학술 등 다양한 분야에서 적용하고자하는 시도들이 있습니다. 생성형 AI에 대한 간략한 개요와 설명 그리고 이를 활용하는 사례, 주의사항 및 기업에서 도입시 고령해야할 사항에 대해 살펴보고자 합니다. I. 생성형 AI의 개요 최근 chatGPT를 사용하여 검색

Naver Blog

유통 데이터 분석 : 공공데이터를 이용한 카페 상권 분석

안녕하세요!! 빅재미입니다. 지난번에 카페 배달매출과 날씨 상관관계에 대해 알아봤었습니다! 유통 데이터 분석 : 카페 배달매출과 날씨 상관관계 분석 안녕하세요!! 빅재미입니다. 거리를 걷다보면 한 블럭 내에도 카페가 많은 것을 볼수 있는데요~ 그만큼... blog.naver.com 이번에는 공공데이터를 이용한 카페 상권 분석을 해볼건데요~ 소상공인시장진흥공단의 상가(상권)정보를 바탕으로 업종분류 중 카페를 식별하여 지역별 혹은 브랜드별 업종 현황을 확인하여 분석결과를 시각화해보겠습니다ㅎㅎ [기대효과] 서울 지역의 각 구별/법정동별 카페수 순위를 확인하여 카페수/생활인구/카페당 생활인구 비율의 상관분석을 통해 생활인구의 낮은빈도에 따른 카페수를 예측 활용 데이터 출처: 공공데이터포털 이번에 사용할 데이터는 2가지로, 영업중인 서울 상가업소 데이터와 서울 생활인구(유동인구) 데이터입니다. [데이터 1] 서울 상가업소 데이터 38개 컬럼 중 10개 컬럼(상권업종분소분류명, 시군구코드, 시

1 2 3 4 5