cslee_official의 등록된 링크

키자드에 등록된 총 477개의 포스트를 확인하실 수 있습니다.

Naver Blog

[전문가 칼럼] 데이터란 무엇인가?

인류문명의 급격한 가속을 가져온 문자나 숫자가 데이터를 나타내는 표현법이기는 하나, 데이터의 근본적인 성질이나 가치는 단순히 문자나 숫자 자체에 있지 않다. 데이터의 진정한 가치는 실제 세상(Real World)의 사물, 사건, 사람의 현상이나 활동을 대변하여 그것을 해석에 활용하는 데에 있다. 실물 칼이 있을 때 이것을 데이터라 부르지 않는다. ‘칼’, ‘Knife’, ‘자르는 것’과 같이 문자로 표현하면 이것을 데이터라 부른다. 칼이 1개라는 숫자 1도 데이터라 부른다. 칼을 촬영한 결과인 사진도 데이터에 해당한다. 즉 실물의 모습을 문자, 숫자, 사진, 동영상 등으로 표현한 형태 모두를 데이터라 부른다. 현상으로서 데이터도 있지만 '칼로 음식을 자르다', '칼을 갈다', '칼을 활용하여 사람을 위협하다' 등은 사건 또는 이벤트를 나타내는 데이터에 해당한다. 10개 칼의 평균 길이는 20cm에 해당한다. 10개 칼의 평균 제작 기간은 12일에 해당한다는 칼이 가지고 있는 여러 개

Naver Blog

유통 데이터 분석 : 쇼핑몰 고객의 다양한 특성 분석 및 매출예측

안녕하세요!! 빅재미입니다. 온라인 매체를 통해 제품이나 서비스를 구매하는 이른바 '이커머스 시장(E-Commerce)'이 확대되어 왔고 앞으로 더욱 규모가 넓어질 것으로 예상되는데요! 고객의 특성과 구매패턴을 다양하게 이용한다면, 광고와 맞춤 상품추천 등을 통해 비즈니스에 큰 도움이 될 듯 합니다. 오늘은 쇼핑몰 고객의 고객의 특성을 이해하고, 구매 데이터와 연계하여 구매 가능성을 예측하고 매출을 유지 및 증가시킬수 있는 방법을 찾아보겠습니다ㅎㅎ [기대효과] - 등록 중인 고객의 주문패턴 및 주요특징을 분석하여 주요 고객층에 대한 파악 - 신규 및 기존 고객특성을 이해하고 구매 가능성이 있는 고객예측을 통한 마케팅 강화 활용 데이터 이번에 사용할 데이터는 2가지로, 쇼핑몰의 고객마스터 데이터와 주문리스트 데이터입니다. [데이터 1] 고객 마스터 데이터 - 크기: 5,000행, 11열 - 고객 특성 분석을 위한 데이터셋 컬럼명 설명 예시 CUST_NO 고객번호 17850 CUST_N

Naver Blog

[Tech 리포트] 성공적인 생성형 AI 서비스를 위한 전략

오현식_롯데정보통신_팀장 생성형 AI 기술과 생태계의 이해를 바탕으로 성공적인 생성형 AI 서비스 도입을 위한 전략과 성공 요인, 실패 요인에 대해 논의합니다. I. 생성형 AI 기술의 이해 생성형 AI는 기존 데이터에서 학습된 내용을 바탕으로 새로운 콘텐츠를 생성하는 인공지능(AI)의 한 유형입니다. 생성형 AI는 인공신경망을 활용하는 딥러닝(DL)의 하위 분야에 있습니다. 생성형 AI를 정확히 이해하기 위해서는 인공지능부터 생성형 AI까지의 관계와 개념에 대해 정확히 이해할 필요가 있습니다. [그림 1] AI와 생성형 AI와의 관계도 인공지능은 판단, 추론, 학습 등 인간의 지능이 가지는 기능을 갖춘 컴퓨터 시스템을 뜻하며 쉽게 말해 사람처럼 사고하고 행동하는 기계를 만드는 것이 목표인 분야라 할 수 있습니다. 머신러닝(ML)은 인공지능의 하위 분야로 데이터를 기반으로 모델이 학습하여 해당 분야의 문제들을 추론하는 기술입니다. 머신러닝은 지도학습, 비지도학습, 강화학습을 통해 모

Naver Blog

뉴스레터 [빅재미 주간소식 2024.5.30]

2024/05 vol.17 2024년 5월 4주차 BigZami 소식 안녕하세요. BigZami입니다. 이번 회차에서는 부동산 데이터 분석을 통한 아파트 집값 예측 사례와 흥미로운 BigZami 기능 업데이트 소식, 2024 재정데이터 분석 교육 소식을 전해 드립니다. 뉴스레터 구독하기

Naver Blog

[2024 산업인력 AI역량강화] 제조산업 전문인력 인공지능 역량강화 지원교육 교육생 모집(교육비 전액 지원)

안녕하세요 BigZami입니다! [2024 산업인력 AI역량강화] 제조산업 전문인력 인공지능 역량강화 지원교육 교육생 모집 소식을 전해드립니다! 자세한 내용은 아래를 참고해주세요 감사합니다.

Naver Blog

뉴스레터 [빅재미 주간소식 2024.5.17]

2024/05 vol.16 2024년 5월 2주차 BigZami 소식 안녕하세요. BigZami입니다. 이번 회차에서는 AI EXPO KOREA 2024 참가 소식, 빅재미 홈페이지 개편 소식, 빅재미 분석 사례 정보를 전해 드립니다. 뉴스레터 구독하기

Naver Blog

[Tech 리포트] 클라우드 네이티브의 개념, 핵심기술 및 전환 전략

디지털 트랜스포메이션의 전환을 비즈니스 핵심 전략으로 삼고 경쟁력을 강화하기 위해, 이를 뒷받침 하는 핵심 기술인 소프트웨어에 대한 관심이 그 어느 때보다도 큰 시기이다. 사용자가 비즈니스에 참여하는 기회가 늘어나고, 이에 민첩하게 대응하기 위해서는 애플리케이션의 확장성과 가용성의 향상, 워크로드의 최적화, 개발부터 제품화에 이르는 애플리케이션 라이프사이클 자동화를 지원하는 클라우드 도입을 통해 실현 가능하다. 본 고에서는 이러한 이점을 극대화하기 위한 클라우드 네이티브(Cloud-Native)의 개념과, 핵심 기술을 소개하고, 여기에 Cloud Native로의 전환을 고려하는 기업을 위한 전략을 제시 하고자 한다. 기업이 디지털 트랜스포메이션을 통해 내·외부 환경 변화에 좀 더 민첩하게 대응하고, 사용자의 비즈니스 니즈를 상시 만족하며, 여기에 비즈니스 연속성과 신뢰성을 최대한 확보하기 위해서는 SW 응용프로그램이나 플랫폼을 구현하고 운영하기 위한 주요 IT 요소 즉, 개발방법론,

Naver Blog

부동산 데이터 분석 : 아파트 집값 예측

안녕하세요!! 빅재미입니다. 최근 부동산 가격이 떨어지고 있다고는 하지만, 여전히 비싸고... 내 집 마련은 힘들고... 그래도 정확한 실거래가를 예측할 수 있다면 합리적인 아파트 매매가 가능하지 않을까요? 이번 글에서는 서울 지역 아파트의 기본정보와 거래정보를 통해 아파트 실거래가를 예측해볼거에요. [기대효과] - 생활과 매우 밀접한 서울 아파트 실거래가 예측 실습을 통한 데이터 분석 가능 - 워드 클라우드 활용 등 비정형 데이터 분석 기능까지 활용 데이터 분석부터 시각화까지 함께 하러 가보시죠~ 활용 데이터 https://dacon.io/competitions/open/235537/data 같이 다뤄볼 데이터는 2016년 서울지역 아파트의 거래정보 데이터로, 국토부 실거래가 데이터를 가공한 것입니다. 아파트의 기본정보와 거래정보가 포함되어 있습니다. 아래 데이터을 이용해 2017년 서울 지역 아파트의 실거래가 예측해보겠습니다!! 컬럼명 설명 예시 거래번호 아파트 거래에 대한 유니

Naver Blog

[2024년 재정데이터 분석 교육] 6월 교육 수강안내

안녕하세요 BigZami입니다! [2024년 재정데이터 분석 교육] 6월 교육 수강안내 전해드립니다! - 교육신청 방법 - - 분석교육 과정 - - 교육장 정보 - 자세한 내용은 아래를 참고해주세요 <구글 폼 교육신청 링크> Google Forms: Sign-in Couldn’t sign you in The browser you’re using doesn’t support JavaScript, or has JavaScript turned off. To keep your Google Account secure, try signing in on a browser that has JavaScript turned on. Learn more Help Privacy Terms forms.gle 감사합니다.

Naver Blog

[Tech 리포트] 클라우드 네이티브 도입 전략 및 활용 시 고려사항

박민수_(주)오케스트로_수석연구원 주요 기업에서 클라우드 도입한 지도 꽤 오랜 시간이 흐른 것 같다. 주요 기업들은 이제 클라우드를 넘어 클라우드 네이티브를 기업 비즈니스를 위한 주요 기술 전략으로 선택을 하고 있다. 기업에서는 더 이상 클라우드의 도입을 미룰 수 없는 현실에 직면했으며 단순 인프라 기반의 클라우드가 아닌 비즈니스에 직접적인 영향을 줄 수 있는 클라우드 네이티브의 도입을 고민하고 이를 활용하기 위한 전략을 알아보고자 한다. I. 클라우드 네이티브 전환의 시대 클라우드는 이제 더이상 신기술이 아닌 범용적인 IT 기술로 자리 잡았다. 인공지능, 머신러닝, 빅데이터 분석, AIOps, MLOps등 새로운 기술 및 서비스가 끊임없이 등장하고 있고 이러한 기술과 서비스들은 거대한 IT 자원과 무한한 확장성 및 안전성을 요구함에 따라 이를 뒷받침할 수 있는 기반으로 클라우드는 동반 성장을 하고 있다. [그림1]을 통하여 국내 클라우드 네이티브의 발전 과정을 볼 수 있다. [그림

Naver Blog

[개념편] 탐색적 데이터 분석(EDA) 이것만 알고가자! - 데이터 탐색, 시각화, 산점도, 노코드분석

안녕하세요, BigZami입니다 :) 오랜만에 따끈따끈한 신규 블록에 대한 사용 매뉴얼을 가져왔습니다. 최근 3월 업데이트에 새롭게 개발된 데이터 탐색 블록인데요! 기존의 데이터 탐색 블록처럼 탐색적 데이터분석을 도와주는 기능으로, 좀 더 사용자의 자유도를 높여 그래프를 표현할 수 있는 블록입니다ㅎㅎ 기존 데이터 탐색 블록 설명 [개념편] 탐색적 데이터 분석(EDA) 이것만 알고가자! - 데이터의 특성, 데이터 탐색, 시각화, 통계, 노코드분석 안녕하세요, BigZami 입니다:) 오랜만에 데이터 전처리에 새로운 블록을 소개하러 왔습니다! 바로바로 [... blog.naver.com 어떤 부분이 기존블록과 다른지 바로 확인해도록 하겠습니다!! 1. 데이터 탐색, BigZami로 해보기 이번 매뉴얼에 사용될 데이터는 Dacon에서 펭귄 몸무게 예측 AI 해커톤에 쓰였던 데이터입니다. 첨부파일 penguins_size.csv 파일 다운로드 간단한 데이터 속 컬럼 정보는 다음과 같습니다.

Naver Blog

[Tech 리포트] 생성형 AI의 금융산업 적용 사례 및 활용 방안

김우규 (주)한국IT마스터즈 대표 2023년 뜨겁게 화두가 되고 2024년에는 필수요소로 대두된 생성형 AI와 금융산업의 연관성을 살펴보고, 이를 적용한 국내외 현황을 기반으로 서비스의 방향성을 검토하여 향후 어떤 서비스 영역에 활용하는 것이 바람직한 방향인지를 살펴보고, 할루시네이션 등의 잘못된 정보에 기반한 금융 서비스의 고객 이익 보호 대원칙이 침해되지 않도록 AI 거버넌스 체계 구축의 중요성에 대한 시사점을 제시해보고자 한다. I. 개요 2022년 12월 챗GPT의 서비스 개시 이후 출시 5일 만에 이용자가 100만명을 돌파하고, 2개월 후엔 1,000만명으로 증가했다고 한다. 처음에는 단순 호기심에 서비스를 이용하는 사람들이 있었다면 이를 한번 이상 이용해 본 사람들은 다양한 산업군에 인간을 보조할 수 있는 도구로서의 생성형 AI의 활용성을 인정할 수 밖에 없었다. 기존 검색엔진에 의존하여 정보 수집 정도에 데이터를 활용하였다면 이제는 좀 더 능동적으로 보고서의 목차를 생성

Naver Blog

[Tech 리포트] AWS 클라우드에서의 MSA 구현

김지혜 _ AWS Korea 온프레미스 환경에서 고객은 모범 사례를 따르고 있는지 확인하기 위해 전사의 기술적 아키텍처 모범 관리를 위한 중앙팀을 보유하는 경우가 많습니다. 전사 기술팀에는 일반적으로 인프라 설계자, SW 솔루션 설계자, 데이터 설계자, 네트워킹 설계자, 보안 설계자 등이 포함됩니다. 이러한 팀은 엔터프라이즈 아키텍처 기능의 일부로 TOGAF 또는 Zachman 프레임워크를 사용하는 경우가 많습니다. AWS에서는 클라우드 환경에 적합한 AWS Well-Architected 프레임워크를 통해 6가지 원칙을 제시하고 있습니다. 이를 통해, AWS에서 제시하는 Cloud Native향 MSA 아키텍처 구현, 고려할 점 그리고 사례를 알아봅니다. I. 컴퓨팅 환경 변화에 따른 패러다임의 변화 [그림1] 컴퓨팅 환경 변화에 따른 패러다임의 변화 많은 엔터프라이즈 기업들이 빠르게 변하는 외부 환경에 애자일 하게 대응하기 위하여 디지털 대전환을 선포하고, 더 빨리 고객을 이해하고

Naver Blog

유통 물류 데이터 분석 : 카드결제 데이터를 활용한 가명처리 기법

안녕하세요!! 빅재미입니다. 데이터 이용 수요가 급증하는 가운데, 가명정보 활용을 위한 법적 근거가 마련된 걸 알고 계신가요? [데이터 3법 개정사항] 신용정보법 개정안 (출처: 대한민국 정책브리핑 정책위키) 이번 블로그 글에서는 BigZami 솔루션을 활용한 가명처리 기법을 소개하고 어떤 기대효과가 있는지 알아 보러 가시죠~!! 삭제 기법과 일반화 기법 가명정보란, 개인정보를 가명처리함으로써 원래의 상태로 복원하기 위한 추가 정보의 사용/결합 없이는 특정 개인을 알아볼 수 없는 정보를 뜻합니다. 가명처리란, 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가 정보 없이는 특정 개인을 알아 볼 수 없도록 처리하는 것을 말합니다. [표1] 가명처리 기법 삭제 기법 일반화 기법 마스킹(Masking) 삭제(suppression): 특정 컬럼 drop 부분삭제(partial suppression): 일부 값 삭제 행 항목 삭제(rocord suppression):

Naver Blog

뉴스레터 [빅재미 주간소식 2024.4.25]

2024/04 vol.15 2024년 4월 4주차 BigZami 소식 안녕하세요, BigZami 뉴스레터입니다. 이번 회차에서는 다들 많이 이용하고 계실, 금융권 마이데이터 서비스에 대한 신규 정책 자료 소개와 No-Code 플랫폼을 이용한 데이터 분석 동향에 대해 공유하려고 합니다. 뉴스레터 구독하기

Naver Blog

씨에스리, 나라장터 엑스포서 '빅재미 엔터프라이즈' 버전 선보여

씨에스리, 나라장터 엑스포서 '빅재미 엔터프라이즈' 버전 선보여 발행일 : 2024-04-26 13:23 <씨에스리 '코리아 나라장터 엑스포 2024' 부스 전경> 인공지능(AI) 기반 데이터 분석 서비스 전문기업 씨에스리(대표 이춘식)는 최근 일산 킨텍스에서 열린 '코리아 나라장터 엑스포 2024'에 참가해 노코드 데이터 분석 솔루션인 '빅재미(BigZami)'의 엔터프라이즈(Enterprise) 버전을 선보였다고 밝혔다. 코리아 나라장터 엑스포는 혁신 기업이 최신 기술과 우수한 품질의 제품을 선보이며, 다양한 구매담당자와 해외 바이어들과 비즈니스 네트워킹을 통해 새로운 비즈니스 기회를 모색하는 박람회다. 올해는 650여개 우수조달기업이 참가해 혁신 제품과 신기술 및 신제품을 공개하는 등 역대 최대 규모로 열렸다. 빅재미 엔터프라이즈는 사용자에 대한 자동 격리구간 제공으로 안정된 성능과 강력한 보안을 지원하며, 기업과 기관에 적합하게 커스터마이징 할 수 있는 기회를 제공한다. 빅재

Naver Blog

씨에스리, AI EXPO KOREA 2024서 '빅재미 엔터프라이즈' 공개

씨에스리, AI EXPO KOREA 2024서 '빅재미 엔터프라이즈' 공개 발행일 : 2024-05-09 14:17 씨에스리의 AI 엑스포 코리아 2024 전시 부스 전경. 인공지능(AI) 기반 데이터 분석 서비스 전문기업 씨에스리(대표 이춘식)는 지난 1일부터 3일까지 서울 코엑스에서 열린 '2024 국제인공지능대전(AI EXPO KOREA 2024)'을 통해 AI 데이터 분석 솔루션인 '빅재미(BigZami)'의 엔터프라이즈(Enterprise) 버전을 선보였다. 국제인공지능대전은 AI 신기술과 트렌드를 살펴보고, 인사이트를 얻을 수 있는 AI 분야 최대 행사다. 매년 영향력을 키우며 한국을 넘어 아시아 최대이자 세계 5대 AI 전시회로 자리매김하고 있다. 올해는 글로벌 AI 워크로드를 선도하는 11개국 300여 기업 및 기관이 참여해 450여 부스 규모로 펼쳐졌다. 씨에스리는 전시 부스에서 컨테이너 기반 공동활용 데이터 분석서비스가 포함된 '빅재미 엔터프라이즈'를 소개하고, 실

Naver Blog

뉴스레터 [빅재미 주간소식 2024.3.14]

2024/03 vol.12 2024년 3월 2주차 BigZami 소식 안녕하세요, BigZami입니다! 3월부터는 봄이 시작되고, 또 새학기가 시작되는 달이라 그런지 본격적이라는 말과 가장 잘 어울리네요. 빅재미 뉴스레터도 본격적으로 좋은 정보와 인사이트를 전달드리기 위해 노력하겠습니다. 이번 호에서는 통계청 통계개발원에서 발행한 칼럼 [통계로 세상 읽기]를 추천하고 BigZami를 통한 수업 평가 만족도 데이터 분석에 관한 설명을 담았습니다. 뉴스레터 구독하기

Naver Blog

철강산업 빅데이터 분석ㅣ저합급강의 기계적 특성 예측

안녕하세요!! 빅재미입니다. 오늘은 철강산업 데이터를 이용한 산업데이터분석(IDX)를 해 볼 건데요~ 합금의 조성비 및 기계적 특성 데이터를 사용하여 저합금강의 특정 기계적 특성을 예측하고, 우수한 기계적 특성 결과를 나타내는 합금 비율 및 특징을 파악할 거에요. 데이터를 가지고 어떤 예측이 가능한지 확인해 보러 가시죠!! 활용 데이터 <철강 데이터> 활용할 데이터는 저합금강의 중량 백분율에 따른 조성 및 강 테스트 중에 관찰된 기계적 특성 값으로, 915 종류의 합금에 대해서 5가지 기계적 특성과, 12개 합금원소 함유율로 구성되어 있습니다. - 1열: 순번 - 2열~6열: 5가지 기계적 특성(인장강도, 내력, 연신율, 단면감소율, 온도) - 7열~18열: 12가지 합금원소 분석 절차 한 눈에 보기 워크플로우 <전체 워크플로우> 전체 강재에 함량된 합금원소의 비율이 5% 이하인 합금 강철을 뜻하는 저합금강의 조성비 및 기계적 특성으로 이루어진 데이터를 활용하여 합금강의 기계적 특성

Naver Blog

[Tech 리포트] 2024년 가트너 10대 기술의 해석

이재두 KRISS 국가참조표준센터 초빙연구원 가트너는 매년 가트너 상위 전략 기술 트렌드 보고서를 발표한다. 이 보고서는 기업과 IT 리더들이 주목해야 할 기술적 변화와 혁신을 예측하고 그에 따른 전략적 조언을 제공함으로써 중요한 참고 자료로 활용되고 있으며 기술 투자와 전략 수립에 중요한 기준점을 제시한다 이 보고서에 담긴 가트너 10대 기술들은 ①AI의 신뢰성, 리스크 및 보안관리(AI TRiSM), ②지속적인 위협 노출 관리(CTEM), ③지속 가능한 기술, ④플랫폼 엔지니어링, ⑤AI 증강 개발, ⑥산업 클라우드 플랫폼, ⑦지능형 응용 프로그램, ⑧생성형 AI, ⑨증강 및 연결된 워크 포스, 그리고 ⑩머신 고객이다. 가트너는 10대 기술 트렌드를 투자 보호, 개발자들의 부상 및 가치 전달의 3개 카테고리로 정리하였고, 이러한 트렌드들은 비즈니스 목표와 시기에 따라 활용할 계획이 결정되며, 향후 36개월 동안 많은 비즈니스 및 기술 결정에 영향을 미칠 것으로 예상하였다. 특히,

Naver Blog

뉴스레터 [빅재미 주간소식 2024.3.28]

2024/03 vol.13 2024년 3월 4주차 BigZami 소식 안녕하세요, BigZami 뉴스레터입니다. 이번 뉴스레터에는 22대 총선이 다가옴에 따라 함께 읽어 보면 좋을 뉴스 한 건과 BigZami를 활용한 시나리오 분석을 가지고 왔습니다. 뉴스레터 구독하기

Naver Blog

엔터테인먼트 데이터 분석(1) : K-Pop 가사 특징 분석(뉴진스, 르세라핌)

안녕하세요!! 빅재미입니다. 전세계적으로 K-Pop에 대한 관심이 꾸준히 증가하고 있는데요ㅎㅎ 그 중에서도 4세대 걸그룹이 주목을 받고 있습니다. K-Pop에 어떤 요소가 히트곡으로 만들어 주는지 궁금하지 않으신가요? 이번 블로그 글에서는 뉴진스와 르세라핌의 히트곡들의 특징을 시각화하고. SNA 기반의 그룹별 핵심 멤버 및 멤버 간 조합 분석을 해볼거에요. [기대효과] -가사에 자주 등장하는 키워드 분석을 통해대중이 관심을 가지는 작사 소재 파악 - 가사 데이터 분석을 통해 언어적인 트렌드나 문화 변화 파악 - 멤버별 파트 조합을 분석하여 작곡/작사에 반영 데이터 분석부터 시각화까지 함께 하러 가보시죠~ 활용 데이터 하이브 소속 대표 걸그룹인 뉴진스와 르세라핌의 발매 음원 전곡의 가사를 파트별로 나눈 데이터로, 각 가사 소절을 부른 멤버의 이름과 노래 정보가 포함되어 있습니다. 컬럼명 설명 예시 order 가사 소절별 순서 1, 2, 3 lyric 노래 가사 vocal1 해당 가사를

Naver Blog

엔터테인먼트 데이터 분석(2) : K-Pop 가사 특징 시각화(뉴진스, 르세라핌)

안녕하세요!! 빅재미입니다. 지난번에 뉴진스와 르세라핌의 히트곡들의 특징을 분석해봤는데요! 엔터테인먼트 데이터 분석(1) : K-Pop 가사 특징 분석(뉴진스, 르세라핌) 안녕하세요!! 빅재미입니다. 전세계적으로 K-Pop에 대한 관심이 꾸준히 증가하고 있는데요ㅎㅎ 그 중... blog.naver.com 이번에는 분석결과를 가지고 라인그래프, 파이차트, 워드 클라우드 등을 통한 다양한 데이터 시각화를 하고 SNA분석 그래프를 자세히 보며 최종결과를 도출해보도록 하겠습니다~ 분석 결과 시각화 1. 그룹별 음원 EDA(라인그래프, 파이차트) '라인 그래프' 블록과 '파이차트' 블록으로 각 그룹의 발매일별 평균 멜론 좋아요 수의 변화와 그룹별 발매 장르 비율, 계절별 발매 음원 수를 확인합니다. 그룹별 음원 인기 변화 (1) 르세라핌 - 르세라핌은 최근에 발매한 음원이 제일 인기가 많음 - OST로 발매한 음원은 인기가 낮음 <발매일별 멜론 좋아요 수 변화 라인그래프 – 르세라핌> (2

Naver Blog

뉴스레터 [빅재미 주간소식 2024.4.4]

2024/04 vol.14 2024년 4월 1주차 BigZami 소식 안녕하세요, 빅재미 뉴스레터입니다. 꽃들이 만개하고 있는 4월입니다. 이번 호에서는 가트너 10대 기술에 대한 칼럼과 BigZami를 통한 재고 관리 분석에에 관한 설명을 담았습니다. 뉴스레터 구독하기

Naver Blog

ABC 분석을 통한 효율적인 재고관리(파레토 법칙, 데이터 범주화, 시각화)

안녕하세요! BigZami입니다 기업에서 물품을 생산하고 관리할 때 효율적인 재고관리는 곧! 기업의 이익과 직결되는데요. 이를 위해 많은 기업에서 ABC분석을 사용하고 있고, 재고관리시에 배경지식으로 알아야할 기본지식 중에 하나라고 할 수 있습니다. 지금부터 ABC분석은 무엇인지 알아보고 어떻게 하면 더 효율적인 ABC 분석을 할 수 있는지 직접 알아보도록 하겠습니다. ABC 분석이란? ABC분석은 경제학자 데키(H. F. Deckie)에 의해 만들어진 것으로, 재고관리·품질관리나 매장의 상품관리 등 많은 분야에서 관리를 효율적으로 하기 위해 사용하는 분석법입니다. 이 분석법은 '전체 품목 중 20%에 해당하는 품목이 매출의 80%를 차지한다'는 파레토 법칙(Pareto’s Law)에 기반하여 중요도를 토대로 품목들을 구분하고, 각 구분에 맞춘 재고관리를 할 수 있도록 합니다. 전체 워크플로우 같이 해볼 분석은 기존 중요도 뿐만 아니라 변동성 항목(변동계수를 이용)을 추가하고 특징별

Naver Blog

뉴스레터 [빅재미 주간소식 2024.2.6]

2024/01/25 vol.09 2024년 2월 1주차 BigZami 소식 안녕하세요, BigZami입니다. 설날 연휴 미리 새해 복 많이 받으세요! 긴 연휴 기간 동안 재충전하는 시간이 되시길 바랍니다. 이번 호에서는 집에서 혼자 따라해 볼 수 있는 BigZami 시나리오 분석(헬스케어 빅데이터 분석)에 관한 설명과 다보스 세계 경제 포럼에 관련된 뉴스를 가지고 왔습니다. 뉴스레터 구독하기

Naver Blog

ABC 분석을 통한 물품 분류별 재고관리법 알아보기(변동계수, 데이터조인, 필터링)

안녕하세요! BigZami입니다 ABC 분석을 통한 효율적인 재고관리(파레토 법칙, 데이터 범주화, 시각화) 안녕하세요! BigZami입니다 기업에서 물품을 생산하고 관리할 때 효율적인 재고관리는 곧! 기업의 이... blog.naver.com 지난 번에 효율적인 재고관리를 위한 방법중 중요도 항목을 통해 ABC 분석을 하는법을 설명드렸는데요! 전체 워크플로우 이번에는 ABC분석에 변동성 항목을 추가해 분류를 세분화하고, 각 분류별 재고관리 방법에 대해 알아보겠습니다. 기존 ABC 분석에서 사용된 데이터에서 새로운 분기(주황색 테두리 부분)를 만들어 진행해볼게요! 변동성 항목 구하기 기존의 데이터로부터 거래량의 평균과 표준편차, 그리고 이를 통해 거래량에 대한 변동계수를 구합니다. a. 평균 거래량 구하기 파생 변수(평균 거래량) ① 함수 선택 옵션에서 MEAN을 선택한 후 괄호 안에 2:7를 입력 ② 이후 파생변수명에 거래량 평균을 입력하고 적용 → 2~7번째 컬럼 평균(거래량)이

Naver Blog

뉴스레터 [빅재미 주간소식 2023.2.22]

2024/02 vol.11 2024년 2월 3주차 BigZami 소식 안녕하세요, BigZami입니다! 이번 호에서는 데이터 시각화에 대해 인사이트를 얻을 수 있는 Informaiton is Beautiful 사이트 및 수상작들을 안내하고 BigZami 시나리오 분석(통신사 데이터를 이용한 고객 이탈률 분석)에 관한 설명을 담았습니다. 뉴스레터 구독하기

Naver Blog

AutoML을 이용한 데이터 분석(자동 전처리, 모델 시뮬레이션, 랜덤포레스트, 분석 알고리즘 추천)

안녕하세요! BigZami입니다 지난 번에 통신사 데이터를 이용해 고객이탈률을 분석하는 시간을 가져봤는데요~ 이전 내용 보러가기 통신사 데이터를 이용해 고객이탈률 분석하기(요금지불방법, 월 청구금액) : 결측치 처리, 피벗테이블, 데이터시각화 안녕하세요! BigZami입니다!! 스마트폰이 있는 사람보다 없는 사람을 찾는게 하늘의 별따기인 시대에! 통... blog.naver.com 여기서는 데이터 전처리부터 모든 분석과정을 직접 생각하고 골랐었죠? 그런데 이 모든 과정을 자동으로 해결할수 있다면 얼마나 좋을까요!! 고객의 이탈을 예측하는 모델을 자동으로 만들어 보러 가시죠~ AutoML이란? 예측모델을 만들기 위해서는 데이터를 정제하는 '데이터 전처리 작업'과 예측모델 분석을 위한 '알고리즘 선택'이 필요합니다. 보통 이 전처리 작업과 알고리즘 선택 작업은 분석에 있어 굉장한 시간이 소요되는데, BigZami의 AutoML(machine learning) 기능은 자동 전처리 기능과

Naver Blog

[개념편] 데이터 추론 알고가자! - XGBoost, 예측모델, 데이터학습

안녕하세요, BigZami입니다. 오랜만에 따끈따끈한 신규 블록에 대한 사용 매뉴얼을 가져왔습니다. 최근 2024년 2월 6일 업데이트에 새롭게 개발된 "추론" 입니다! 추론 블록은 BigZami에서 생성한 분석 모델을 사용하여 새로운 데이터 파일 혹은 직접 입력한 데이터로 예측을 수행할 수 있도록 하는 기능입니다. 기존 데이터 분석 메뉴의 모델들로 데이터를 학습시키고 예측하여 어느정도 성능이 나왔는지 확인을 했다면, 그 모델로 어떻게 예측되는지 알고 싶은 데이터를 연결하여 실질적으로 적용할 수 있다는 거죠! 그럼 이제 사용법을 알아보도록 하겠습니다! 1. 데이터 추론, BigZami로 해보기 이번 매뉴얼 예제에서 사용할 데이터는 USA의 King 이라는 곳의 집 값을 예측할 수 있는 파일입니다. 첨부파일 House Sales in King County_USA.csv 파일 다운로드 지난 XGBoost 사용 매뉴얼에서 이것을 예제로 하여 포스팅 한 적이 있었는데요, 이 예제의 뒤를 이

Naver Blog

랜덤포레스트와 변수 중요도(피벗 테이블, 파생변수, 라인그래프, 시각화)

안녕하세요, BigZami입니다! 지난 포스팅에서 AutoML 기능을 이용해 자동 전처리와 모델시뮬레이션을 해보고 랜덤포레스트로 변수중요도를 알아봤는데요~ AutoML을 이용한 데이터 분석(자동 전처리, 모델 시뮬레이션, 랜덤포레스트, 분석 알고리즘 추천) 안녕하세요! BigZami입니다 지난 번에 통신사 데이터를 이용해 고객이탈률을 분석하는 시간을 가져봤... blog.naver.com 이번에는 랜덤포레스트에서 변수 중요도가 높게 나온 변수들이 어떻게 이탈여부에 영향을 끼치는지 분석해볼게요ㅎㅎ 변수 중요도에 대한 이해 변수 중요도(Feature Importance) 지표를 볼 때 주의해야 할 것이 있는데, 해당 알고리즘이 보여주는 중요도가 절대적인 것이 아니라는 점입니다. 가령, 랜덤포레스트에서 상대적으로 적은 중요도를 가진 계약유형 변수가 의사결정나무 알고리즘에서는 가장 중요한 변수로 나오기도 합니다. 이러한 중요변수는 각 알고리즘을 통한 모델형성 맥락에서 이해해야 합니다. 즉,

Naver Blog

[BigZami] 컬럼 타입 이미지의 의미(시각화, integer, numeric, character 등)

안녕하세요, BigZami입니다. 지난 2월 시각화 블록 메뉴를 통틀어서 변경된 부분을 설명드리기 위해 포스팅 써봅니다 :) 데이터의 종류 데이터의 종류에는 뭐가 있을까?(범주형 데이터, 수치형 데이터) [범주형 데이터, 수치형 데이터 한 눈에 알아보기] 이번 글은 데이터를 다루기에 앞서, 기본적인 데이터의 ... blog.naver.com 컬럼 타입 이미지의 의미 [그림1] 컬럼타입 UI변경 - 히스토그램 예시 이번에 업데이트가 되면서 시각화 전체 블록의 컬럼 선택란의 UI가 변경되었습니다! 바로 빨간 상자로 표시한 타입 부분인데요. 기존에는 [그림1]의 좌측처럼 텍스트로 컬럼타입을 알려드렸다면, 현재는 우측 컬럼 타입을 이미지로 시각화하여 한눈에 볼 수 있도록 변경했습니다. 이미지에 따른 컬럼 타입은 다음과 같습니다. [그림2] 컬럼타입 이미지 시각화 블록 사용할 때 참고해주시고! 추가로, X축(또는 라벨), Y축(또는 값)을 선택할 때 컬럼타입의 제한이 많이 완화되었으니 보

Naver Blog

수업만족도와 학생들의 학업성적 연관성 분석(상관분석, 평행좌표계, 시각화)

안녕하세요! BigZami입니다!! 지난번에 '초등학교 수업만족도 데이터'를 이용해 특정 이벤트 전후의 변화와 효과성을 알아봤는데요~ 수업만족도 설문조사 데이터를 통한 수업평가과 만족도 분석 (이벤트 전후 변화, 서술형 항목 시각화) 안녕하세요! BigZami입니다!! 설문조사는 특정 모집단이나 표본집단을 대상으로 적절한 설문문항을 작성... blog.naver.com 오늘은 '수업만족도와 학생들의 성적에 어떤 연관성'이 있는지 직접 분석해볼 예정입니다ㅎㅎ 아래 파일을 다운받고 BigZami '데이터 불러오기'에서 열어주면 오늘 해볼 빅재미 시나리오를 함께 따라해볼 수 있습니다!! 첨부파일 국영수 점수 데이터2.xlsx 파일 다운로드 데이터 불러오기 우선 전 학년의 점수 데이터를 데이터를 불러왔습니다. 데이터 리스트 <국영수 점수 데이터> 개인특성정보 : 학번 학생 성적 정보 : 수학, 국어, 영어, 종합(총합 평균) 자료 요약 자료 요약 블럭으로 데이터를 살펴본 결과 수학, 국어,

Naver Blog

씨에스리, 과기정통부 우수기업연구소 선정

씨에스리, 과기정통부 우수기업연구소 선정 발행일 : 2024-01-31 09:19 <이춘식 씨에스리 대표(오른쪽)와 강인호 씨에스리 연구소 수석이 과학기술정보통신부 지정 우수기업연구소 지정서를 펼쳐보이고 있다.> 씨에스리는 자사 '빅데이터&AI기술연구소'가 과학기술정보통신부가 지정하는 우수기업연구소로 선정됐다고 밝혔다. 우수기업연구소는 2017년도부터 과기정통부가 연구개발 역량이 탁월하고 기술혁신 성과가 우수한 기업연구소를 선정해 지원하는 제도다. 지금까지 총 286개 기업연구소가 지정됐다. 씨에스리 빅데이터&AI기술연구소는 독자적으로 연구개발한 AutoML기술이 결합된 데이터 분석 솔루션 BigZami를 상용화해 국내 공공기관과 민간시장에 공급하고 있다. 또 인공지능(AI) 기반 전력 제어 소프트웨어(SW), 비전AI기술 기반 지능형 공장부품불량 검출 SW, 보안 AI SW, 마케팅인텔리전스 AI SW 등 AI와 빅데이터 분야의 우수한 융합 SW 기술을 보유했다. 이춘식 씨에스리

Naver Blog

수업만족도 설문조사 데이터를 통한 수업평가과 만족도 분석 (이벤트 전후 변화, 서술형 항목 시각화)

안녕하세요! BigZami입니다!! 설문조사는 특정 모집단이나 표본집단을 대상으로 적절한 설문문항을 작성하여 원하는 정보를 얻어내기 위해 이용됩니다ㅎㅎ 어느 분야에서든 설문조사는 진행이 가능하기 때문에, 만족도 조사부터, 여론조사, 기업이미지 설문조사 등 다양한 설문조사를 접하면서 살아왔는데요~ 이런 설문조사를 통해 각종 기업/기관에서는 문제와 개선점을 파악하고 앞으로의 방향성을 수립하고 있습니다. 그 중에서도 오늘은 '초등학교 수업만족도 데이터'를 이용해 특정 이벤트 전후의 변화와 효과성을 알아보겠습니다 전체 분석 워크플로우 사전 설문데이터 분석 후 사후데이터를 조인해서 T검정과 각종 데이터시각화를 하는 과정을 알아볼게요~ 아래 파일을 다운받고 BigZami '파일로 시작하기'에서 열어주면 오늘 해볼 빅재미 시나리오를 함께 따라해볼 수 있습니다!! 첨부파일 초등학교 설문조사.bzm 파일 다운로드 데이터 불러오기 우선 1~5학년 대상, 6학년대상 설문조사 데이터를 불러왔습니다. 데이

Naver Blog

뉴스레터 [빅재미 주간소식 2023.1.25]

2024/01/25 vol.09 2024년 1월 1주차 BigZami 소식 안녕하세요, BigZami입니다. 1월을 맞이하여 2024년 IT 트렌드를 미리 살펴볼 수 있도록 2024 가트너 전략 기술 트렌드와 2024 CES에 대한 소식을 가져왔습니다! 뉴스레터 구독하기

Naver Blog

뉴스레터 [빅재미 주간소식 2023.1.2]

2024/01/02 vol.08 2024년 1월 1주차 BigZami 소식 안녕하세요, BigZami입니다! 2024년 청룡의 해, 첫 인사 드립니다. 용이 나오는 꿈을 꾸면 대박이 날 것 같은 기분이 드는데, 마침 또 청룡의 해라니! 어쩐지 좋은 기운이 들어올 것 같다는 생각이 듭니다. 여러분들의 새해 계획도 응원하며 BigZami도 더 좋은 콘텐츠로 찾아 뵙도록 하겠습니다. 노코드 빅재미 - 예스24 분야 열기/닫기 국내도서 (3) 결과 내 재검색 열기/닫기 검색어 입력 입력하신 키워드로 재검색 합니다. 검색 조건 열기/닫기 도서명 저자/역자 출판사 혜택 열기/닫기 이벤트 쿠폰 사은품 가격 열기/닫기 전체 5천원 이하 5천원 ~ 1만원 1만원 ~ 3만원 3만원 ~ 5만원 5만원 이상 최저금액 ~ 최고금액 입력하신 가격대로 검색합니다. 브랜드 열기/닫기 아이리포 (3) 출간일 열기/닫기 전체 1개월 이내 3개월 이내 6개월 이내 1년 이내 3년 이내 도서 상세 검색 열기/닫기 책소

Naver Blog

통신사 데이터를 이용해 고객이탈률 분석하기(요금지불방법, 월 청구금액) : 결측치 처리, 피벗테이블, 데이터시각화

안녕하세요! BigZami입니다!! 스마트폰이 있는 사람보다 없는 사람을 찾는게 하늘의 별따기인 시대에! 통신사들은 고객들은 유치하기 위해 다양한 마케팅과 영업을 펼치고 있는데요~ 통신사가 가지고 있는 내/외부 데이터를 활용하고 분석하면, 고객관리에 유용할 뿐만 아니라 인사이트를 활용한 신사업 발굴 등 다양한 목적으로 사용이 가능합니다 ㅎㅎ 다양한 분석 중 오늘 BigZami를 이용해 해볼 내용은 '통신사 데이터를 이용해 고객이탈을 분석'해 보는 시나리오를 같이 해볼거에요c 전체 분석 워크플로우 피봇테이블과 그룹연산 작업을 통해 원하는 데이터를 그룹화하고 시각화까지 하는 방법을 알아볼게요~ 아래 파일을 다운받고 BigZami '파일로 시작하기'에서 열어주면 오늘 해볼 빅재미 시나리오를 함께 따라해볼 수 있습니다!! 첨부파일 통신사 고객데이터 분석 시나리오.bzm 파일 다운로드 파일로 시작하기 데이터 확인하기 통신사 고객 데이터를 불러왔는데요, 무려 7043개의 데이터나 되네요! <통

Naver Blog

[헬스케어] 고혈압 단계별 PPG 신호 특징 분석

안녕하세요!! 빅재미입니다. 오늘은 헬스케어 데이터를 이용한 산업데이터분석(IDX)를 해 볼 건데요~ 환자들의 데이터 중 광용적맥파(PPG) 신호 데이터를 사용해서 진폭과 맥파 전달 시간을 계산하고 고혈압 단계별 특징을 파악할 거에요. 데이터 간에 어떤 상관관계가 있는지 확인해 보러 가시죠!! 활용 데이터 PPG(광용적맥파) 데이터 <데이터 자료 요약> 해당 데이터는 219명의 환자들의 신체 정보 데이터와 광용적맥파 데이터로 구성되어 있습니다. 그 중에서 광용적맥파(PPG) 데이터를 사용하여 분석을 진행했습니다. Subject_ID 0 1 2 3 4 2 2438 2438 2438 2455 2455 3 1973 1973 1990 1990 1979 6 2003 2003 1978 1978 1978 - 219명의 환자들의 신체 건강 데이터와 광용적맥파 데이터로 구성 - 표준화된 실험 조건에서 수집된 데이터 *데이터 제공: 중국 계림 인민 병원 *데이터 출처: figshare 분석 절차 한

Naver Blog

[IT TREND] 가트너 선정, 2024년 10대 전략 기술 트렌드

안녕하세요. 빅재미입니다! 얼마 전 가트너(Gartner)는 2024년 10가지 주요 전략기술 트렌드를 발표했습니다. 주요 트렌드로는 생성형 인공지능(AI)의 대중화 속에 따라 AI 안전, AI를 활용한 소프트웨어 개발, 지능형 애플리케이션, 업무 최적화 등의 흐름이 주목받을 것으로 전망됐는데요. 가트너의 VP 애널리스트인 바트 빌렘센은 "기술 혼란과 사회경제적 불확실성에는 임시방편적인 대응보다 과감하게 행동하고 전략적으로 회복탄력성을 강화하려는 의지가 필요하다"며 "이러한 불확실성과 압박 속에서 비즈니스의 지속적인 성공을 위한 전략적 기술 투자 로드맵을 수립할 수 있는 것은 IT 리더들"이라고 말했습니다. 1. 보편화된 생성형 AI(Democratized Generative AI) 대규모로 사전 학습된 모델, 클라우드 컴퓨팅 및 오픈 소스의 결합으로 생성형 AI가 보편화되면서 전 세계 업무자들은 이러한 모델에 접근할 수 있게 됐습니다. 가트너는 2026년까 80% 이상의 기업이 생

Naver Blog

[CSLEE] 2024년 갑진년(甲辰年) 새해인사

안녕하세요. 씨에스리입니다. 지난 2023년, 저희에게 보내주신 성원에 진심으로 감사드립니다. 푸른용의 해인 2024년 갑진년(甲辰年)에도 변함없은 사랑과 성원 부탁드리며, 항상 건강하시고 바라던 소망과 계획했던 일들이 모두 결실로 맺어지는 행복한 한 해 되시길 바랍니다. 앞으로도 많은 사랑과 성원 부탁드립니다. - (주)씨에스리 올림 -

Naver Blog

데이터 분석을 위한 빅재미 활용과 튜토리얼 - ②붓꽃 종류 분류하기

안녕하세요, BigZami입니다!! 빅재미 솔루션을 이용해서 데이터 분석을 처음 시작하시는 분들을 위해 튜토리얼 두 가지를 제공하고 있는거 아시나요? 지난 번에 알려드렸던 ① Tutorial1 : 기본 사용법에 이어 오늘은 ② Tutorial2 : 붓꽃 종류 분류하기 를 해볼거에요ㅎㅎ Iris 데이터를 사용해 붓꽃의 종류(Speices)를 분류하는 랜덤 포레스트 모델을 만들어보는 튜토리얼인데요!! 튜토리얼에 들어가는 법을 모르신다면 아래 링크를 참고해주세요! 데이터 분석을 위한 빅재미 활용과 튜토리얼 - ①기본 사용법 안녕하세요, BigZami입니다!! 빅재미 초보사용자를 위한 튜토리얼이 있다는 사실 알고 계셨나요? 빅재미 ... blog.naver.com 그렇다면 붓꽃 종류를 분석하러 지금 바로 가시죠~ 혹시 아직 빅재미 회원가입 안하신 분이 있다면!! 아래 링크에 들어가서 회원가입-로그인 먼저 해주세요~ 빅재미 솔루션 접속 링크 BigZami app.bigzami.com 두

Naver Blog

씨에스리, '소프트웨이브 2023' 빅재미 부스 현장스케치

안녕하세요, 씨에스리입니다!! 지난 11월 29일(수) 부터 12월 1일(금)까지 3일간 삼성 코엑스 A홀에서 열린 '소프트웨이브 2023'에 참여했습니다. 이번에 제 8회를 맞이한 소프트웨이브는 대한민국을 대표하는 국내 최대규모의 소프트웨어 전시회로서, 저희 씨에스리의 노코드(No-Code) 데이터 분석 솔루션인 빅재미(BigZami)를 소개하는 자리를 마련했습니다 No-Code 데이터분석 솔루션 '빅재미' 빅재미 부스 전경1 2023 소프트웨이브의 '빅재미' 부스입니다. BigZami(빅재미)는 전문적인 분석과정을 간단하게 할 수 있는 노코드 데이터분석 솔루션으로, 데이터 불러오기, 전처리, 분석, 시각화 등 데이터 분석 전 과정에 필요한 다양한 기능을 제공하고 있습니다. 70종 이상의 분석 블록을 제공해 빅재미만으로 전처리, 탐색적 데이터분석(EDA), 시계열 분석, 통계분석, 공간 시각화, 머신러닝 모델생성 등 전 과정이 모두 가능하며, 데이터 분석의 흐름을 보여주는 직관적인

Naver Blog

[SOFTWAVE 2023] (주)씨에스리 '빅재미' 부스에 방문해 주셔서 감사합니다.

안녕하십니까? (주)씨에스리입니다. 지난 11월 29일부터 12월 1일까지 열린 '2023 대한민국 소프트웨어대전'에서 저희 씨에스리 부스를 방문하여 'BigZami(빅재미)'에 많은 관심을 가져주신 여러분들께 감사 인사드립니다. BigZami(빅재미)는 전문적인 분석과정을 간단하게 할 수 있는 노코드(No-Code) 데이터분석 솔루션으로, 데이터 불러오기, 전처리, 분석, 시각화 등 데이터분석 전 과정에 필요한 다양한 기능을 최고의 품질과 기술력으로 지원하고 있습니다. 문의 사항이나 기술지원이 필요하신 경우는 언제든 연락주시면 즉각 대응해드리겠습니다. 고객 여러분들의 관심과 성원 다시 한 번 감사드리며, 앞으로도 저희 (주)씨에스리는 최고의 서비스를 제공할 수 있도록 최선을 다하겠습니다.

Naver Blog

데이터 분석을 위한 빅재미 활용과 튜토리얼 - ①기본 사용법

안녕하세요, BigZami입니다!! 빅재미 초보사용자를 위한 튜토리얼이 있다는 사실 알고 계셨나요? 빅재미 솔루션을 이용해서 데이터 분석을 처음 시작하시는 분들을 위해 튜토리얼 두 가지를 제공하고 있는데요! ① Tutorial1 : 기본 사용법 ② Tutorial2 : 붓꽃 종류 분류하기 두 가지 튜토리얼 중 오늘은 기본 사용법을 같이 해보시죠 ㅎㅎ 빅재미 솔루션에 접속해서 상단메뉴 맨 오른 쪽에 '튜토리얼'을 클릭해 주세요. 두 가지 튜토리얼이 뜨는 것 볼 수 있는데, ① Tutorial1 : 기본 사용법 을 누르면 오늘쪽 아래에 상세 튜토리얼 목록이 뜹니다. 앞으로 이렇게 5개의 STEP으로 튜토리얼이 진행될거니까 잘 따라오세요!! ^_____^ STEP 1 워크플로우 화면 기능 설명 Step1을 클릭 해주면 빅재미 워크플로우의 기본 화면설명을 자세히 볼 수 있어요. 블록메뉴, 워크플로우 화면, 주메뉴, 계정정보, 보조옵션, 미니맵 등 화면에서 중요한 기능들이 무엇이고 각각 어떤

Naver Blog

[업데이트] 10월 빅재미 신규/추가 기능

안녕하세요 BigZami입니다~ 날씨가 요즘 쌀쌀한거 보니 완연한 가을이 온거 같네요!! 그래도 일교차가 아직은 심하니 감기 조심하세요 ㅎㅎ 10월에는 어떤 기능들이 추가/개선됐는지 보러 가시죠 1. [회귀분석] 분석 유형별 모델 히스토리 통합 기존에 [회귀분석] 블록에서 분석 유형별(Linear, Ridge, Lasso, ElasticNet) 각각 생성되던 모델 히스토리를 하나로 합쳐 관리, 탐색을 더 쉽게 수행할 수 있습니다. [그림1] 회귀분석 모델 히스토리 통합 2. 스타차트의 스케일링 기능 추가 [스타차트]에 스케일링 기능이 추가되었습니다. 스케일링 기능으로 컬럼 간의 비교를 쉽게 수행할 수 있습니다. [그림2] 스타차트 스케일링 기능 추가 앞으로 더 좋은 서비스를 제공하기 위해 노력하는 BigZami가 되겠습니다! 혹시 BigZami 이용 중에 문의사항이 발생하신다면 아래 링크를 이용해주세요^^ BigZami 버그 관련 문의 안녕하세요. BigZami 담당자 입니다. 앞으

Naver Blog

씨에스리, 2023 WKBC 세계한인비즈니스대회 참가!

2023.10.11(수)~13(금) 세계 각지의 재외동포 경제인들과 국내 기업인들이 자율적으로 참여하여 상생의 글로벌 네트워크를 구축하고, 한민족 경제 영토를 넓혀 나가는 국제 비즈니스의 장인 '제 21차 세계한인비즈니스대회'에 씨에스리가 서울경제진흥원과 서울관에 참가했습니다. 미국 캘리포니아 오렌지카운티 애너하임 컨벤션 센터에서 3일간 열렸는데요! 세계한인비즈니스 대회는 '세계한상대회'의 새로우운 이름으로 2002년 처음 시작되어 지난해까지는 국내에서 열렸지만, 올해는 한인의 미주이민 120주년과 한미동맹 70주년의 역사적 의의을 기념하기 위해 처음으로 미국에서 개최됐습니다. 행사장 로비 전경 31개국에서 7800여명의 기업인이 참가했고, 관람객만 3만명을 방문하는 등 역대 최대 규모의 성과를 거두었다고 합니다. 세계한인비즈니스대회 서울관 전경(좌) / 씨에스리 서울관 전시부스(우) 씨에스리는 이번 전시에서 코딩이 필요 없는 No-Code 데이터분석 솔루션 '빅재미(BigZami)

Naver Blog

씨에스리, 중기벤처부 '인재육성형 중소기업' 선정

씨에스리, 중기벤처부 '인재육성형 중소기업' 선정 발행일 : 2023-10-18 13:56 <씨에스리> 데이터·인공지능(AI) 분야 전문기업인 씨에스리(대표 이춘식)는 중소벤처기업부가 주최하는 '인재 육성형 중소기업'으로 선정됐다고 18일 밝혔다. 인재 육성형 중소기업은 전문 지식을 갖춘 우수 인력을 채용하거나 교육훈련에 투자해 기업의 생산성과 수익성을 높이고, 그 결과를 근로자들과 공유해 기업과 임직원이 함께 성장하는 모범적인 기업이다. 이러한 기업은 서면과 현장 평가를 통해 심사되어 지정된다. 평가 기준으로 성장성 수익성 안정성 고용 증가 및 성과 공유 교육훈련 서면 평가 인재 확보 노력 복지·인프라 수준 HRD 지원체계 구축 및 교육훈련 수준 현장평가 등 엄격한 평가를 통해 선정한다. 씨에스리는 임직원의 업무 능력 향상을 위해 자기 계발비 지원 자격증 취득 지원 학자금 지원과 같은 복리후생을 제공하고 있다. 또한 자유롭고 활기찬 조직 문화를 위해 사내 동호회 활동 생일 축하금과

Naver Blog

뉴스레터 [빅재미 주간소식 2023.10.19]

2023/10/19 vol.07 2023년 10월 1주차 빅재미 소식 매월 두 번 Data Insight를 담아 찾아오는 빅 소식! 빅재미 뉴스레터 안녕하세요, 빅재미입니다! 낮밤 일교차로 인해 다시 감기가 성행한다고 합니다. 모두 환절기 감기 조심하시기 바랍니다. 지난 번 뉴스레터에서 안내했던 대로 빅재미 에듀 사이트가 오픈 되었는데요. 새로운 소식이 업데이트 될 때마다 뉴스레터로 빠르게 안내 드리도록 하겠습니다! 01. 빅재미 뉴스 - 빅재미 에듀 사이트 오픈 소식 02. 빅재미 사용 Tip - 연관분석, 이것만 알고 가자! 빅재미 에듀 사이트가 오픈되었습니다! 빅재미 에듀 사이트는 누적 1만명 이상의 빅데이터 분석가와 인공지능SW 개발자를 양성한 전문 교육기관의 전문 노하우를 반영한 체계적인 교육 프로그램과 실습 환경을 제공합니다. 수준별 맞춤형 교육과정(초/중/고급) 교육에 필요한 교안, 실습파일, 데이터셋 제공, 분야별 다양한 실습 시나리오 No-Code 분석 실습환경 과제

Naver Blog

뉴스레터 [빅재미 주간소식 2023.09.15]

2023/9/15 vol.05 2023년 9월 3주차 빅재미 소식 매월 두 번 Data Insight를 담아 찾아오는 빅 소식! 빅재미 뉴스레터 안녕하세요, 빅재미입니다! 무더운 8월을 지나 벌써 9월이 되었습니다. 빅재미는 교육(Edu) 콘텐츠 오픈을 앞두고 있어 바쁜 9월을 보내고 있는데요. 빅재미를 이용하여 더 쉬운! 더 재미있는! 데이터 분석을 하실 수 있도록 열심히 준비하고 있으니 많은 기대 부탁드립니다! #많관부! 가을의 초입과 다가올 황금 연휴를 기다리며 마음의 여유가 샘솟는 9월 되시길 바랍니다. 01. 빅재미 뉴스 - 씨에스리 CEO에게 듣는 '데이터 분석 트렌드'와 '빅재미' 02. 전문가 칼럼 - 왜 데이터 과학(Data Science)이라고 했을까? 03. 사용 TIP 노하우 - 트리맵(Tree Map), 이것만 알고 가자! 데이터 분석의 최근 트렌드와 미래는? 데이터 트렌드와 빅재미는 무슨 관련이 있을까? 빅재미 솔루션은 무엇일까? 노코드(No-Code) 데

Naver Blog

뉴스레터 [빅재미 주간소식 2023.10.06]

2023/10/06 vol.06 2023년 10월 1주차 빅재미 소식 매월 두 번 Data Insight를 담아 찾아오는 빅 소식! 빅재미 뉴스레터 안녕하세요, 빅재미입니다! 즐거운 한가위 보내셨을까요? 행복한 추석 연휴가 끝나고 어느덧 연말까지 약 13주밖에 남지 않았다고 합니다! 연초에 세워두었던 목표들을 점검하고 다시 한번 심기일전하여 마음을 다 잡으실 수 있도록 빅재미가 응원하겠습니다. c 01. 빅재미 뉴스 - '노코드(No-Code) 빅재미'로 배우는 도서 시리즈 출간 02. 빅재미 사용 Tip - 의사결정나무, 이것만 알고 가자! 03. 빅재미 뉴스 - 씨에스리, 경찰청 대상 '데이터기반행정 빅데이터' 교육 성료 '노코드(No-Code) 빅재미'로 배우는 도서 시리즈가 출간 되었습니다. 누구나 자신의 분야에서 데이터로 인사이트를 도출할 수 있어야 하는 시대, 빅재미를 통해 코딩 없이 데이터 분석, 인공지능, 통계 분석을 익혀 보세요 구매 혜택 도서 구매시 빅재미 에듀

Naver Blog

뉴스레터 [빅재미 주간소식 2023.08.14]

2023/8/14 vol.03 2023년 8월 빅재미 소식 안녕하세요, 빅재미입니다! 매월 두 번 Data Insight를 담아 찾아오는 빅 소식! 다사다난했던 8월 첫 주, 다들 잘 지내셨나요? 이번 8월 vol.03 호에는 01. 빅재미 뉴스 (파트너 데이 / 우수 기업연구소 선정) 02. 사용 TIP 노하우 (빅재미-클릭센스 연동하여 데이터 시각화하기) 03. 빅재미 라이브러리 소개 와 관련된 내용을 담았습니다. 직접 빅재미를 이용해 쉽고 간편하게 데이터 분석을 경험해 보세요! 빅재미 파트너데이 기사 전문 보러가기 우수 기업연구소 지정기사 전문 보러가기 분석한 데이터를 다양하게 시각화하는 방법! R, 파이썬 프로그래밍을 다룰 줄 몰라도, 노코드(No-Code)로 빅재미에서 손쉽게 데이터 분석하고, 클릭센스에 연동해서 '시각화 대시보드'로 결과까지 확인이 가능하다구요? 빅재미와 클릭센스 연동시, 시너지 효과 발생! c Qlick Sense 1. R 사용을 위한 복잡한 플러그인 구

Naver Blog

뉴스레터 [빅재미 주간소식 2023.08.30]

2023/8/30 vol.04 2023년 8월 4주차 빅재미 소식 매월 두 번 Data Insight를 담아 찾아오는 빅 소식! 빅재미 뉴스레터입니다 구독자 여러분들은 처서 매직이란 말을 들어보셨나요? 처서 매직은 처서(處暑)와 매직(Magic)을 뜻하는 합성어로 처서만 지나면 c마법처럼 더위가 가신다는 뜻인데요. 올해도 처서인 8월 23일을 기점으로 아침저녁 약간의 선선함을 느끼셨으리라 생각됩니다. 코앞까지 다가온 9월, 선선한 가을 바람을 느끼며 빅재미에는 또 어떤 재미있는 기능이 있는지 같이 알아보시죠! 이번 8월 vol.04 호에는 두 가지 소식을 담아 왔습니다! 01. 빅재미 뉴스 (빅재미 7·8월 업데이트 소식) 02. 사용 TIP 노하우 (데이터 범주화, 이것만 알고 가자!) (1) 행 변경 중복 Data 처리 기능 개선 행 변경 유형 중 '중복 Data 처리' 사용 시 중복 확인 대상 컬럼을 직접 선택할 수 있는 기능이 추가되었습니다! (2) 행 변경 사항 저장 기능

Naver Blog

[빅재미 뉴스레터 Vol.2] 빅재미(BigZami)로 따라해 보는 데이터 분석 시나리오!

2023년 7월 빅재미 소식 안녕하세요, 빅재미입니다! 매월 두 번 Data Insight를 담아 찾아오는 소식! 다행히 더위가 가장 심하다는 대서(大暑)는 지나갔고, 이제 입추(立秋)만을 기다리고 있습니다. 빅재미를 이용한 "데이터 분석 방법과 예시"를 요청하는 분들이 많으신데요. 그래서 이번 7월호에는 빅재미란 무엇인지 신규기능 업데이트 셀프 주유소 가격비교 시나리오 를 담았습니다. 직접 빅재미를 이용해 쉽고 간편하게 데이터 분석을 경험해 보세요! 1. 애니 차트의 버블 차트 추가 2. 바로가기 아이콘 생성 기능 추가 3. AutoML 신규 추가 4. BigZami 블록 공통화 적용 5. 수행 가능한 데이터 타입 확장 6. 데이터 병합 블록 UI 개선 업데이트 내용 보러 가기 자차 보유량과 이동량이 많은 오늘 날, 시내를 돌아다니시다 보면 휘발유 가격이 높아 고민이 된 적 많으셨죠! 빅재미 툴을 통해 어떻게 저렴한 셀프 주유소를 찾아 볼 수 있는지 같이 확인해 보세요! 관련

Naver Blog

[개념편] 이상 처리, 이것만 알고가자! - 박스플롯, outlier, IQR, DBSCAN, 데이터 전처리, 노코드 분석

안녕하세요, BigZami 입니다! 지난 포스팅에서는 데이터 전처리 과정 중에 결측치 처리란 무엇이고 어떻게 하는지 알려드렸죠? [개념편] 결측치 처리, 이것만 알고가자! - 무작위 결측, NA, NaN, NULL, 데이터 전처리, 노코드 분석 안녕하세요, BigZami입니다:) 오늘은 데이터 전처리를 할 때 가장 많이 사용하는 기능인 데이터 결측치 ... blog.naver.com 오늘도 전처리 중 아주 많이 사용되는 이상치 처리의 개념과 사용법을 함께 알아보도록 하겠습니다~ 1. 이상치(Outlier)란? 이상치(Outlier)란, 보통 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 큰 값을 말합니다. 어떤 의사결정을 하는데 필요한 데이터를 분석 혹은 모델링할 경우, 이러한 이상치가 의사결정에 큰 영향을 미칠 수 있기 때문에 데이터 전처리 과정에서의 적절한 이상치 처리는 필수적입니다. 그렇다면 '데이터의 범위에서 많이 벗어난' 혹은 '아주 작은/큰'이라는 것은 정확히 어

Naver Blog

씨에스리, 경찰청 대상 '데이터기반 행정 빅데이터' 교육 성료

씨에스리, 경찰청 대상 '데이터기반 행정 빅데이터' 교육 성료 발행일 : 2023-09-19 13:23 <씨에스리는 경찰청과 소속기관 직원을 대상으로 데이터기반 행정 교육을 진행했다.> 씨에스리(대표 이춘식)는 경찰청과 소속기관 직원을 대상으로 데이터기반 행정과 현장 과학적 치안 역량 강화를 위한 '빅데이터 교육'을 성공적으로 진행했다고 19일 밝혔다. 교육 과정은 경찰청 소속·산하 기관 직원의 빅데이터·인공지능(AI) 기술 활용 역량을 강화함으로써 치안 분야 맞춤형 빅데이터 전문가를 양성하는 등 데이터 기반행정 실현을 위해 실시됐다. 빅데이터 교육과정은 공공 빅데이터 개요 데이터기반 행정 이해 빅데이터 분석 개념 데이터 수집·전처리 데이터의 분석방법론·시각화 Q-GIS 공간분석 분석 알고리즘·머신러닝 이해 등으로 구성, 데이터 교육을 통해 분석기술 배양을 목적으로 한다. 특히, 단계별 실무형 프로젝트와 '빅재미를 활용한 데이터분석' 과목을 운영해 민생현안 문제제시 해결방안 데이터

Naver Blog

[개념편] 결측치 처리, 이것만 알고가자! - 무작위 결측, NA, NaN, NULL, 데이터 전처리, 노코드 분석

안녕하세요, BigZami입니다:) 오늘은 데이터 전처리를 할 때 가장 많이 사용하는 기능인 데이터 결측치 처리에 대해 알려드리려고 합니다ㅎㅎ 어떤 분석방법을 사용하느냐도 물론 중요하지만, 데이터를 어떻게 전처리하는가에 따라서 최종 분석 결과에 크게 영향을 미칩니다 그러면 함께 결측치가 무엇이고 처리방법에는 무엇이 있을지 알아보도록 할게요~ 1. 결측치란? 결측치란 누락된 데이터 즉, 값이 표기되지 않은 값을 뜻합니다. 주로, NA, NaN, NULL로 표기되는데요. Python의 경우 "정해지지 않은 값"이란 의미로 함께 사용하지만, R의 경우에는 각각 의미가 다르게 사용되고 있습니다. ① NA (Not Available) : 결측값 ② NaN (Not a Number) : 0/0처럼 수학적으로 정의가 되지 않는 값 ③ NULL : 값이 존재하지 않음 NA와 NaN는 하나의 "값"으로 인식하는 반면, NULL은 값 자체가 없다고 생각하면 됩니다. 2. 결측치 종류 결측치는 아래의

Naver Blog

[개념편] 의사결정나무(Decision Tree) 이것만 알고가자! - 지도학습, 머신러닝, 가지치기, 노코드 분석

안녕하세요, BigZami입니다! 오늘은 지난 포스팅에서도 말씀드렸듯이 데이터 분석 블록 중 "의사결정나무"에 대해 알아보려고 해요c [개념편] 랜덤 포레스트(Random Forest) 이것만 알고가자! - 기계학습, 의사결정나무, 배깅, 앙상블 모델, 노코드 분석 안녕하세요, BigZami입니다!! 오늘은 기계학습(Machine Learning) 종류의 기능블록의 사용 매뉴얼을 안... blog.naver.com 대표적인 지도학습 분석 방법인 의사결정나무의 개념을 알아보고 BigZami로는 어떻게 사용하면 되는지 살펴보도록 하겠습니다. 1. 의사결정나무(Decision Tree)란? 의사결정나무(Decision Tree)란, 각 데이터들이 가진 속성들로부터 패턴을 예측 가능한 규칙들의 조합으로 나타내며, 이를 바탕으로 분류를 수행할 수 있도록 하는 지도학습 모델입니다. 의사결정나무는 분류와 회귀 모두 가능한 모델입니다. 범주나 연속형 수치 모두 예측할 수 있다는 말인데요!! 어떠한

Naver Blog

[개념편] 랜덤포레스트(Random Forest) 이것만 알고가자! - 기계학습, 의사결정나무, 배깅, 앙상블 모델, 노코드 분석

안녕하세요, BigZami입니다!! 오늘은 기계학습(Machine Learning) 종류의 기능블록의 사용 매뉴얼을 안내해드릴려고 합니다 기계학습 하면 떠오르는 모델, 무엇이 있을까요? 저는 랜덤포레스트 (Random Forest)가 가장 먼저 생각나네요~ 고로 오늘의 주제 Random Forest 입니다!!!! 이 포스팅 이후에 다음에 예정된 주제는 의사결정나무인데 랜덤포레스트의 차이를 함께 말씀드리면 너무 좋을 것 같아서 준비해봤습니다 ㅎㅎ 자세한 내용은 이론을 통해 알아보고 BigZami로 어떻게 사용하는지 알려드리도록 하겠습니다:) 1. 의사결정나무와 랜덤포레스트 의사결정나무는 학습데이터에 따라 생성된 모델들이 매우 달라지기 때문에 일반화하여 사용하는 데 어려움이 따라요. 이것이 바로 오버피팅 (Overfitting)이죠!! 즉, 학습에 쓰인 데이터에 너무 잘 맞추어져 있어 다른 데이터가 들어왔을 때는 크게 성능이 좋지 않다는 것입니다. 그래서 의사결정나무에서도 가치지기와 같

Naver Blog

[개념편] XGBoost 이것만 알고가자! - 앙상블 모델, 부스팅, 배깅, GBM, 머신러닝, 노코드 분석

안녕하세요, BigZami 입니다:) 요새 BigZami 사용 매뉴얼 포스팅을 자주 업로드하죠? 저희 빅재미는 언제나 사용자분들이 데이터를 분석하시는데 더 유용하게 사용하실 수 있도록 BigZami 사용 매뉴얼을 소개하는데 주력하고 있답니다 그럼 오늘은 포스팅 주제인 XGBoost에 대해서 알아보도록 할까요? 1. XGBoost란? Extreme Gradient Boosting의 약자로, Boosting 기법을 이용하여 구현한 대표적 알고리즘인 GBM(Gradient Boosting Machine)을 병렬 학습이 지원되도록 구현한 분석 모형입니다. 회귀와 분류 문제를 모두 지원하며, 성능과 자원 효율이 좋아서 인기있는 모형이기도 합니다. 처음보는 용어들이 있죠? 모두 XGBoost를 알기 위해서는 알아야 하는 개념들입니다. 지금부터 하나하나 설명해드리도록 할게요~ 2. Boosting 여러 개의 약한 학습기를 조합해서 강한 학습기를 만드는 앙상블(Ensemble) 기법 중 하나입니다

Naver Blog

[BIG DATA] 데이터분석 프로세스 5단계 쉽게 정리하기

안녕하세요, BigZami 입니다:) 올해도 처서(處暑)를 기점으로 아침저녁 조금씩 선선해지고 있습니다ㅎㅎ 데이터분석을 하면서 중요한 것은 코딩이나 분석테크닉이 아니라 데이터분석의 흐름과 어떤 과정으로 진행되는지 아는 것이 중요한데요! 이번 글에서는 '데이터분석 프로세스 5단계'에 대해 함께 알아보도록 하겠습니다 1단계 - 데이터 문제정의 문제는 분석의 대상이면서 분석의 목적이기도 합니다. 따라서 문제가 제대로 설정되지 않으면 분석 목표가 불분명해지기 때문이죠! 이런 경우, 분석 과정 내내 방황하다가 성과없이 끝나기 쉽습니다 나침반 없이 바다를 항해하는 것과 같기 때문에 데이터 분석에서 문제정의가 가장 중요하지만 그만큼 가장 어려운 단계입니다. 해당 단계가 어려운 이유는 다음과 같습니다. - 많은 사람들이 공감할 만한 가치가 있는 문제를 찾아야 한다. - 향후 정의된 문제 해결을 위한 구체적인 행동이 수반되어야 한다. - 데이터의 제약사항을 극복해야한다.(데이터 확보 등) - 데이터

Naver Blog

[개념편] 사용자 데이터(User Data) 이것만 알고가자! - 데이터 불러오기, 데이터셋, 데이터수집, 엑셀, Excel, 노코드 분석

안녕하세요, BigZami 입니다:) 오늘은 BigZami의 데이터 불러오기 파트 중 '사용자 데이터' 블록을 소개해드리겠습니다. 그럼 바로 사용자 데이터 블록이 무엇이며, 어떻게 사용하는지 볼까요?? 1. 사용자 데이터란? 사용자 데이터 블록은 EXCEL 형식으로 되어 있어 사용자가 직접 데이터를 입력하여 생성할 수 있게 하는 블록입니다. 기존의 '빈 테이블' 블록의 경우, 테이블 형식의 데이터를 복사하여 붙여넣기해서만 데이터를 생성할 수 있어 사용자가 직접 입력을 할 수 없었는데요!! 이러한 부분을 보강하기 위하여 만들어진 블록이랍니다~ 2. 사용자 데이터, BigZami로 해보기 ① 사용자 데이터 블록 생성하기 [그림1] 사용자 데이터 블록 위치 사용자 데이터는 데이터 불러오기 메뉴에 위치한 블록입니다. 워크플로우에 사용자 데이터 블록을 생성해주세요. ② 데이터 입력하기 사용자 데이터 블록 사용화면입니다. 평소에 자주 사용하던 엑셀(Excel)형식과 유사하죠? [그림2] 사용자

Naver Blog

[업데이트] 7, 8월 빅재미 신규/추가 기능

안녕하세요 BigZami입니다 무더운 여름 잘 보내고 계신가요? 덥고 끈적한 더위를 피해 어디론가 떠나버리고 싶은 날이네요!! 지난번 5, 6월에 업데이트된 빅재미 기능을 알려드렸었는데요~ 7, 8월에는 기존의 있던 블록 내의 기능들을 추가/개선했습니다. 어떤 변화가 있었는지 보러 가시죠ㅎㅎ 1. 행 변경 중복 DATA 처리기능 개선 행 변경 유형 중 '중복 DATA 처리' 사용 시 중복 확인 대상 컬럼을 직접 선택할 수 있는 기능이 추가되었습니다. [그림1] 중복 DATA 처리기능 개선 [중복 DATA 처리 사용 방법] ① 변경유형에서 '중복 DATA 처리' 선택 ② '중복 확인 대상 컬럼' 에서 컬럼 선택 (복수 선택 가능) - 중복 확인 대상 컬럼 : 어떤 컬럼 내 데이터의 중복을 체크할 것인지 선택 - 전체 선택할 경우, 모든 컬럼의 데이터가 같아야 중복 데이터로 인식 ③ 적용하기 버튼 클릭 - 중복 데이터가 있을 경우, 그 중 첫번째 데이터를 제외한 나머지 데이터 행을 제거

Naver Blog

[개념편] 연관분석 이것만 알고가자! - 지지도, 신뢰도, 향상도, Apriori 알고리즘, 노코드 분석

안녕하세요, BigZami 입니다:) 예전 버전의 연관규칙을 사용했던 분들은 리뉴얼된 연관분석을 어떻게 사용해야할 지 모르실 텐데요!! 그런 의미에서 오늘은 "연관분석"에 대해 소개해드리겠습니다. 1. 연관분석이란? 연관분석이란, 상품이나 서비스를 구매하는 등 일련의 거래나 사건 안에 존재하는 항목 간의 일정한 연관 규칙을 발견하는 분석입니다. 다른 말로는 장바구니 분석이라고 하기도 합니다. 보통 'A를 구매했을 때, B 또한 구매할 것이다' 와 같은 패턴으로 어떤 물건을 샀을 때 다른 물건을 살 가능성을 확인하는데 이용하기도 합니다. 예시로, 미국의 한 마트에서 연관분석을 수행하였더니 기저귀를 구매한 사람은 맥주를 구매한다는 결과가 나왔다고 합니다. 이런 결과를 이용하면 그에 맞게 마트 측에서는 전략을 세워 상품의 진열을 바꾸어 소비를 더 촉진시킬 수 있겠죠? 2. 연관분석의 측정지표 어떤 물건을 샀을 때 다른 물건을 살 가능성을 구하기 위해서는 몇 가지 측정 지표들이 필요합니다.

Naver Blog

씨에스리, 과기부 '2023 상반기 우수 기업연구소'에 선정

씨에스리, 과기부 '2023 상반기 우수 기업연구소'에 선정 발행일 : 2023-07-31 19:10 <씨에스리는 과기정통부로부터 2023년 상반기 우수 기업 연구소에 선정됐다.> 씨에스리(대표 이춘식)는 빅데이터&AI 기술연구소가 과학기술정보통신부 주관 '2023년 상반기 우수 기업연구소'에 선정됐다고 2일 밝혔다. 과학기술정보통신부는 2023년도 상반기 우수기업연구소를 공모하고 심사를 거쳐 34개 기업부설 연구소를 우수기업연구소로 지정했다. 우수 기업연구소 지정제도는 연구역량이 우수하고 기술혁신 의지 및 활동이 탁월한 기업부설 연구소를 선정해 벤치마킹 모델로 육성, 지원하는 사업이다. 우수 기업연구소에 선정되면 3년간 지위가 유지되며 산업기술진흥협회로부터 각종 홍보 지원, 정부포상, 국가 R&D사업 선정우대 등 혜택이 주어진다. 빅데이터&AI 기술연구소는 2014년에 설립해 빅재미(오토ML 기반의 노코드 데이터 분석 SW) 빅베이스(빅데이터 수집·저장·분석 플랫폼) 인공지능(AI

Naver Blog

씨에스리, '2023 빅재미 파트너 데이' 개최…빅데이터 분석 솔루션 장점 소개

씨에스리, '2023 빅재미 파트너 데이' 개최…빅데이터 분석 솔루션 장점 소개 발행일 : 2023-07-31 19:10 <이춘식 씨에스리 대표가 빅재미 파트너 데이에서 상생 발전 방안을 소개하고 있다.> 씨에스리(대표 이춘식)는 지난 21일 본사 5층 HR컨설팅센터에서 '2023 빅재미 파트너 데이(BigZami Partner Day)'를 열고 파트너사를 대상으로 빅재미 솔루션의 특징과 강점 2023년 파트너사 정책 기술지원 전략 및 운영 프로그램 등 올해 파트너와 동반성장하기 위한 전략과 방안을 공유했다고 31일 밝혔다. 전혜경 씨에스리 부대표는 노코드 데이터분석 솔루션인 '빅재미' 관련 도입 효과성 기술우수성 연관서비스 등 2023년의 빅재미의 주요 특징과 사업전략을 발표했다. 특히 'EASY(Easy Automated Smart analytics for You)'라는 키워드를 강조하며, 빅재미는 쉽고 단순한 사용법을 통해 빅데이터 분석의 전문성 높여주는 솔루션으로 소개했다.

Naver Blog

[BigZami] 컬럼명 규칙 - 변수명, 특수문자, 숫자, 빈칸, 노코드 분석

안녕하세요, BigZami 입니다:) BigZami 잘 활용하고 계신가요? 오늘은 BigZami 사용 중에 궁금하실만한 부분을 포스팅으로 들고 왔습니다. 가끔 데이터를 불러올 때, 원래 내가 지정한 데이터의 컬럼명과 BigZami에서 보여지는 컬럼명이 다를 때가 있죠? 그 이유는, BigZami를 개발하기 위해 사용하는 프로그래밍 언어 상 변수명으로 사용할 수 없는 명명 규칙이 존재하기 때문이랍니다! 그래서 BigZami에서는 사용할 수 없는 컬럼명이 들어왔을 때 사용할 수 있게끔 자동으로 처리를 해주고 있는데요, 어떤 규칙으로 처리를 해주는지 이번 포스팅으로 정리해드릴게요!!! BigZami 컬럼명 명명 규칙 ① 컬럼명의 구성 : 알파벳과 한글 등의 언어, 숫자, _(언더스코어), .(마침표) 로만 구성 가능 ② 컬럼명의 공백, 특수문자 : _(언더스코어)로 변환 BigZami에서 인식하여 _(언더스코어)로 변환하는 특수문자 "ASCII Code의 범위가 33~126인 문자" "U

Naver Blog

[전문가 칼럼] 지능형 IoT 기술 동향 및 요소 기술

1999년 MIT공대의 Auto-ID센터 연구에서 기원을 찾을 수 있는 IoT(사물 인터넷)는 그 후, 지속적인 발전과 진화를 거듭해오고 있다. 2000년대엔 스마트 홈이, 그리고 2010년대에는 독일에서 시작된 공장 자동화 패러다임인 인더스트리 4.0이 등장하였다. 또한, 2020년대에 들어서 급격히 그 관심과 완성도가 높아지고 있는 AI(인공지능) 기술과 결합하면서 과거에 비해 월등히 지능화된 서비스를 제공할 수 있게 되었으며, 그 서비스 또한 전 산업영역으로 넓혀가고 있다. 여기에서는 지능형 IoT 요소 기술에 대해 설명하고자 한다. 지능형 IoT 요소 기술 1. 복합, 고도화가 진행되는 지능형 센서 기술 IoT 센서는 종단에 위치하는데, 기존의 IoT센서는 센싱을 통해 수집한 각종 정보를 IoT 허브를 통해, 클라우드에 위치한 IoT 컨트롤 센터에 전송하거나, IoT 컨트롤 센터의 명령에 따라 특정한 작업을 처리하는 단순한 역할만을 수행하였다. 그러나 최근 들어 수집된 데이터

Naver Blog

NLP(2) : 자연어 처리(Natural Language Processing) 와 딥러닝(Deep Learning)

최근 자연어 처리(Natural Language Processing) 분야는 신경망 기반 딥러닝(Deep Learning) 알고리즘을 적용하여 성능이 비약적으로 개선되었다. 문맥 기반(context-based) 시퀀셜 데이터(sequential data) 분석을 지원하는 순환신경망(RNN), LSTM, 나아가 현재 각광받고 있는 Bert, GPT 기계 번역 모델의 기반이 되는 Transformer 알고리즘 등이 모두 신경망 구조를 갖고 있다. 1. 딥러닝(Deep Learning) 알고리즘이란? 딥러닝(Deep Learning)은 머신 러닝(Machine Learning)의 일종이고, 일반적인 머신 러닝 알고리즘과 달리 신경망 (Neural Networks) 구조를 취하는 머신 러닝 알고리즘을 딥러닝 알고리즘이라고 부른다. 비용함수를 계산하는 방법은 기존 머신 러닝 방법과 딥러닝 방법이 유사하지만, 신경망 구조의 여부에 따라 수학적 모델 및 학습 방법에서 차이가 나타난다. 특히 자연

Naver Blog

[전문가 칼럼] 왜 데이터 과학(Data Science)이라고 했을까?

왜 데이터 과학(Data Science)라고 했을까? 미국에서 백인이 아닌 사람이 최초로 당선된 2008년 대선 결과는 미국 뿐만 아니라 전 세계 정치에 관심있는 사람들에게 매우 신선하면서도 충격에 가까운 대선 결과였다. 이 당시에 버락 오바마의 젊음, 패기, 매력적인 연설도 대선을 승리로 이끈 원동력이기도 했으나, 또 하나 주목할 만한 사실은 빅데이터(Big Data) 기술을 활용해 각종 정책의 반응을 실시간으로 파악하여 사람들의 욕구와 반응에 적시에 그리고 효과적으로 부합할 수 있도록 해낸 것이었다. 이후에 많은 자료에서는 버락 오바마 대선 승리의 숨은 공로로 빅데이터가 있었다고 이야기하였다. 빅데이터 빅데이터(Big Data) 키워드는 2012년 세계경제포럼에서도 떠오르는 10개 기술 중에서 Best로 선정될 정도로 핵심 IT신기술 키워드에 해당했다. 대규모(Volume)의 데이터를 데이터 형식과 상관없이(Variety) 빠른 속도(Velocity)로 수집, 저장, 분석, 표현

Naver Blog

[개념편] 데이터 범주화 이것만 알고가자! - 범주형, 수치형, 데이터 구간화, 노코드 분석

안녕하세요, BigZami 입니다:) 이번에 새로 업데이트 된 데이터 전처리 블록인 "데이터 범주화"에 대해 소개해드리겠습니다!! 어떤 기능이고 어떻게 사용하면 되는지 살펴볼까요? 그 전에 데이터 종류에 대해 궁금하신 분들은 아래 링크 참고해주세요!! ^o^ 데이터의 종류에는 뭐가 있을까?(범주형 데이터, 수치형 데이터) [범주형 데이터, 수치형 데이터 한 눈에 알아보기] 이번 글은 데이터를 다루기에 앞서, 기본적인 데이터의 ... blog.naver.com 1. 범주형 데이터란? 데이터 범주화는 범주형 데이터로 바꾸는 것을 의미하는데요, [그림1] 범주형 데이터란 여기서 범주형 데이터란 몇개의 범주(Category)로 나누어지는 수치로 측정이 불가능한 데이터를 말합니다. 범주형 데이터에는 다음과 같이 크게 2가지를 포함합니다. ① 순위형 데이터 (Ordinal Data) [그림2] 순위형 데이터 - 범주들 간에 순서가 있는 데이터 - 값이 달라짐에 따라 좋거나 나쁘다고 의미를 부여

Naver Blog

[데이터 시각화] 애니차트로 다양한 그래프 한 번에 그리기

안녕하세요, BigZami입니다!! 최근 빅재미 업데이트가 이루어졋던 5월 18일에 신규 블록인 [애니차트]의 시각화 차트기능 추가가 최종 완료되었는데요, 애니차트란? 한 블록 내에서 자유롭게 다양한 그래프를 그려낼 수 있는 기능으로 크게 이론적으로 어렵거나 자세히 설명해야할 부분은 없기 때문에 바로 BigZami에서 어떻게 사용하는지 보러가시죠! 1. 애니차트, BigZami로 해보기 BigZami에서도 샘플로 제공하고 있는 titanic 데이터를 가지고 진행해보도록 할게요 ① 데이터 불러오기 [그림1] 데이터 불러오기 [Data 파일] 블록을 통해 titanic 샘플 데이터를 불러와주세요. ② 애니차트 연결 [그림2] 애니차트 블록 연결 그런 다음, 데이터 시각화 블록에 있는 [애니차트]와 연결해주세요. 이제 애니차트 화면으로 들어가 어떻게 사용하는지 설명드릴건데요, 그전에!! 애니차트가 어떤 기능을 하는 블록인지 말씀드릴게요. 현재 시각화 카테고리에는 많은 시각화 블록이 있습니

Naver Blog

[개념편] 군집 시뮬레이션 이것만 알고가자! - 실루엣 계수, 군집분석, DBSCAN, 계층적 군집화, 노코드 데이터 분석

안녕하세요, BigZami 입니다!! 가장 최근에 업데이트 된 내용 중에 이번 2023년 4월 20일 새로운 블록이 추가되었던 것 기억하시나요? 바로 "군집 시뮬레이션" 인데요, 블록명만 들어도 어떤 기능을 하는지 감이 잡히지만 좀 더 자세히 알려드리겠습니다 1. 군집 시뮬레이션이란? 계속해서 BigZami를 사용하셨던 분이라면 블록명이 그렇게 낯설지는 않으실 거예요. "모델 시뮬레이션" 기억하시나요? 기존 BigZami의 모델 시뮬레이션을 통해, 회귀 또는 분류의 여러 모델들을 학습시켜 그 결과를 한눈에 비교할 수 있었죠? "군집 시뮬레이션" 또한 여러 군집 모델을 한번에 돌려 각 모델별로 군집 결과가 어떻게 나오는지를 비교할 수 있는지 기능을 제공하는 블록입니다. 차이점이라고 하면! [그림1] 회귀/분류 성능지표 비교 모델 시뮬레이션의 경우 X와 Y를 모두 선택하여 학습 결과와 그에 맞는 Accuracy, R2 등 성능지표를 비교했지만, [그림2] 실루엣 계수 비교 군집 시뮬이션

Naver Blog

[업데이트] 5, 6월 빅재미 신규/추가 기능

안녕하세요 BigZami입니다 밖에 돌아다니면 땀이 조금씩 나는 걸 보니 초여름의 문턱이네요!! 봄인가 했더니 어느새 여름으로 넘어가나 봅니다 ㅎㅎ 지난번 3, 4월에 업데이트된 빅재미 기능을 알려드렸었는데요~ 5, 6월 빅재미에 추가된 기능은 애니차트의 버블차트 추가와 바로가기 아이콘 생성기능 추가, 그리고 AutoML 신규 추가입니다! 새로운 기능을들 자세히 보러 가시죠^^ 1. 바로가기 아이콘 생성기능 추가 데스크탑에 바로가기 아이콘이 생성되는 기능이 추가되었습니다. 주소창에 빅재미 주소를 입력하지 않아도 바탕화면에서 바로 빅재미로 이동할 수 있습니다. [그림1] 바로가기 아이콘 생성 기능 [사용방법] ① 로그인 화면의 '바로가기 추가' 클릭 ② BigZami.url 다운로드 ③ 다운로드 받은 경로에 BigZami 바로가기 아이콘 생성 2. AutoML 기능 추가 워크플로우에 블록을 하나씩 생성하지 않고 한번에 데이터 불러오기부터 회귀/분류 모델링 과정을 수행할 수 있는 Aut

Naver Blog

[전문가 칼럼]AIoT(지능형 사물인터넷)의 국내외 발전 동향 및 AIoT 품질 구현

1. 배경 2021년 6월 맥킨지&컴퍼니(McKinsey & Company)는 “The Top Trends in Tech”[1] 보고서에서 차세대 프로세스 자동화(Next-level process automation), 프로세스 가상화(Process virtualization), 연결의 미래(Future of connectivity), 분산 인프라(Distributed infrastructure), 차세대 컴퓨팅(Next-generation computing), 응용 인공지능(Applied AI), 프로그래밍의 미래(Future of programming), 트러스트 아키텍처(Trust architecture), 바이오 혁명(Bio Revolution), 차세대 재료(Next-generation materials), 청정기술의 미래(Future of clean technologies) 등을 10대 분야 미래 기술로 분석하여 제시하였다. KISTEP 2021 [2] 에 의하면 이 중

Naver Blog

[개념편] 메타분석(meta-analysis) 이것만 알고가자! - 선행연구분석, Forest plot, Funnel plot, 노코드 데이터 분석

안녕하세요, BigZami입니다!! 오늘은 여러분께 생소할 수도 있는 [메타분석]의 사용매뉴얼을 들고 왔습니다. 간단한 이론 설명과 함께 어디에 어떻게 사용하면 되는지 설명드리도록 하겠습니다. 1. 메타분석(meta-analysis)이란? 메타 분석이란, 하나의 주제에 대해 연구한 여러 개별 선행연구들의 결과를 양적으로 통합하기 위해 사용하는 통계적 방법 분석입니다. 그러니까 새로운 분석을 하는 것이 아니고 기존에 있는 연구들의 결과를 기반 삼아 분석을 하는 방법인 것이죠. 메타분석을 하는 이유 새로운 연구를 하는 것이 아니라 왜 기존의 연구결과를 가지고 분석을 하는 것일까요? 이유는 다음 3가지에 있습니다. ① 검정력 증가 및 정밀성 향상 : 개별 연구의 표본은 크기가 매우 작기 때문에 여러 개별 연구 결과의 결합을 통해 표본 크기를 증가시켜 검정력과 정밀성을 높일 수 있음 ② 개별 연구에서 조사하지 않은 질문에 답하기 위함 : 서로 다른 특성을 가진 개별 연구 사이에 일관성을

Naver Blog

[개념편] 데이터 탐색(EDA) 이것만 알고가자! - 데이터의 특성, 탐색적 데이터분석, 시각화, 통계, 노코드분석

안녕하세요, BigZami 입니다:) 오랜만에 데이터 전처리에 새로운 블록을 소개하러 왔습니다! 바로바로 [데이터 탐색] 블록인데요. 자세한 설명은 아래에서 보시죠! 1. 데이터 탐색(EDA)이란? https://velog.io/@yuns_u/EDA-Exploratory-Data-Analysis 데이터 탐색(EDA)이란, Exploratory Data Analysis의 약자로 '탐색적 데이터 분석'이라는 뜻입니다. 데이터 분석에 있어서 중요한 초기 분석 단계인데요, 내가 가진 데이터의 특성을 알아보는 작업이라고 보시면 됩니다. 그래야 이 데이터로 어떤 문제를 어떻게 해결할 수 있을지를 결정할 수 있기 때문이죠! 데이터 탐색 방법 데이터 탐색 방법은 크게 2가지가 있습니다. ① 시각화 차트 혹은 그림 등을 그려서 데이터의 분포 혹은 변수와 변수와의 관계를 확인하는 방법입니다. ② 통계 평균, 중앙값, 이상치 등과 같은 요약 통계 정보를 가지고 변수의 특성을 살펴보는 방법입니다. 그

Naver Blog

씨에스리, 2023년 고용노동부 강소기업에 선정

씨에스리, 2023년 고용노동부 강소기업에 선정 발행일 : 2023-05-22 10:23 <씨에스리 로고> 빅데이터·인공지능(AI) 기업 씨에스리(대표 이춘식)는 고용노동부가 주관한 ‘2023 강소기업’에 선정됐다고 22일 밝혔다. 강소기업은 고용노동부에서 우수한 중소·중견기업의 정보제공과 인식개선을 위해 2012년부터 선정 발표하는 제도로 올해 2만 7682개 기업이 명단에 등재됐다. 강소기업은 고용유지율과 신용평가 등급이 높고, 최근 3년 이내 산재 사망 발생이 없는 등 평가 항목을 기준으로 선정한다. 선정된 기업에겐 앞으로 1년간 채용지원, 기업홍보, 재정금융, 세무조사 우대 등 각종 혜택이 주어진다. 창립 이후 씨에스리는 매년 성장세를 기록하고 있다. 최근 베트남에 지사를 설립하는 등 사업 규모 확장에 힘쓰고 있다. 또한, 빅재미(노코드 데이터분석 솔루션) ERgrin(데이터모델링 솔루션) Remon(NoSQL 모니터링 솔루션) CSMig(데이터전환 솔루션) 등 다양한 솔루션

Naver Blog

[BIG DATA] AutoML이란 무엇인가? (노코드 분석)

안녕하세요, BigZami 입니다! 분석을 하는 사람들이라면 요즘에도 계속해서 뜨는 주제가 있죠. 바로 AutoML 입니다! 이 AutoML 기능이 BigZami에도 일부 스며들어 사용하고 계시다는 것을 아시나요? 오랜만의 사용팁/활용법 포스팅에서는 AutoML이 무엇이며 BigZami에선 어떤 기능으로 활용되고 있는지 살펴보겠습니다. __ AutoML 이란? AutoML은 Automated Machine Learning 의 줄임말로, 자동화한 머신러닝을 의미합니다. 무엇인지 감이 잡히시나요? 즉, 인공지능의 한 분야로 컴퓨터가 스스로 학습하도록 알고리즘과 기술을 개발하는 일을 말합니다. 데이터 전처리부터 알고리즘 수행 후 결과까지 일괄적으로 자동화시켜 전체 머신러닝 수행에 들어가는 노력을 줄이거나, 완전히 없애주는 기술이죠! 보통의 머신러닝을 수행하고자 하면 아래 도표와같이 여러 절차를 진행하여야 합니다. [그림2] 머신러닝 수행절차 처음 데이터를 입력받으면 데이터 전처리 작업을

Naver Blog

[개념편] 스태킹(Stacking) 이것만 알고가자! - 앙상블, 배깅(Bagging), 부스팅(Boosting), 메타모델, 노코드분석

안녕하세요, BigZami입니다~~ 저번 포스팅에서 예고했던 대로 Stacking의 사용 매뉴얼 포스팅을 들고 왔습니다! 바로 보실게요! 1. 앙상블(Ensemble)이란? [그림1] 앙상블 출처: https://blog.naver.com/woosa7/220825080440 앙상블은 머신러닝 모델의 성능을 향상할 때 많이 쓰이는 방법으로, 하나의 모델이 아닌 여러 학습 모델을 활용해 학습을 진행시키는 방법입니다. 앙상블 개념은 지난 포스팅에서도 종종 설명드렸던 개념이죠? 랜덤포레스트 사용 매뉴얼에서 Bagging, XGBoost 사용 매뉴얼에서는 Boosting을 설명드렸는데요. ( Bagging 설명 다시보기 ) 빅재미(BigZami) 사용 매뉴얼 :: 랜덤포레스트 (2022.03.29 수정) ** 2022년 3월 29일 업데이트로 랜덤포레스트의 결과물인 변수중요도 부분이 수정되었습니다. ** 안녕하세요, BigZami 담당자 Jay 입니다!! 벌써 BigZami ... cafe.

Naver Blog

[개념편] 요인분석(Factor analysis) 이것만 알고가자! - 고유값, 인자분석, 요인점수, 노코드분석

안녕하세요, BigZami 입니다! 지난번에 t-SNE라는 차원축소 방법에 대해서 알아보았죠? [개념편] t-SNE(t-distributed Stochastic Neighbor Embedding) 이것만 알고가자! - 머신러닝, 차원축소, t-분포, 군집, PCA, 노코드 안녕하세요, BigZami 입니다:) 바로 저번에! 데이터 시각화 블록에 대한 모든 포스팅을 끝마치고, 오늘부... blog.naver.com 오늘은 요인 분석의 원리와 개념에 대해 알아보고 실제로 어떻게 분석에 적용하는지 직접하러 가시죠!! 1. 요인분석이란? 요인분석이란? 다수의 변수간의 관계나 문항들의 상호관계를 분석해서 상관성이 높은 관계와 문항을 선별하여 이를 요인으로 정하고, 이 요인의 의미를 설명하는 통계 방법입니다. 예를 들어, 과자에 대한 평가를 한다고 하면 달콤한가, 짠가, 매운가 이런 문항들을 [맛] 이라는 공통적인 요인으로 정하여 설명하거나 이 요인과 다른 변수 간의 관계가 적절한지 분석하는

Naver Blog

코딩 몰라도 '데이터분석 · AI모델링' 원스톱으로...씨에스리, 노코드 솔루션 ‘빅재미' 선보인다!

발행일 : 2023.04.23 11:14 지난 AI EXPO 씨에스리 부스 전경 인공지능(AI) 기반 데이터 분석 서비스 전문기업 씨에스리(대표 이춘식)는 오는 5월 10일부터 12일까지 사흘간 서울 코엑스에서 열리는 아시아 최대 '제6회 국제인공지능대전(AI EXPO KOREA 2023)'에 참가해 데이터분석 솔루션 ‘빅재미(BigZami)’를 선보인다. 'AI EXPO KOREA 2023'는 2018년 첫 개최 이후 국내 AI 생태계 조성과 인공지능 산업의 발전과 활성화를 위해 인공지능·데이터 전문 기업들과 연구 및 학계 관계자들이 관련 인사이트를 공유하고 소통하는 장으로 단일 인공지능 행사로 아시아 최대 전시회로 자리매김 했다. 씨에스리는 이번 전시에서 노코드(No-Code) 데이터분석 솔루션 '빅재미(BigZami)'를 중심으로 부스를 운영, 코딩을 몰라도 데이터분석과 AI모델링을 할 수 있는 가능성을 제시한다. 각종 기업·기관에 실제로 빅재미가 적용된 사례를 부스 방문자들을

Naver Blog

(주)씨에스리, AI EXPO KOREA 2023 국제인공지능대전에 '빅재미'로 참여

안녕하세요? 빅재미입니다. (주)씨에스리가 다가오는 2023년 5월 10일(수) ~ 12일(금)까지 3일 동안 2023 국제인공지능대전 AI EXPO KOREA에 참가합니다. AI EXPO KOREA(국제인공지능대전)는 2018년 시작한 국내 최대 인공지능 전문 전시회로 올해 6회차를 맞이한 AI 전문 기업들이 매년 참가하는 대규모 행사입니다. 씨에스리는 No-Code 데이터분석 솔루션 '빅재미'로 참가하게 되었습니다. 이번 전시회에서는 No-Code 데이터분석 기술은 물론, 각종 기업·기관에 실제로 빅재미가 적용된 사례를 부스 방문자들을 대상으로 소개하고 1대1 상담존을 운영해 솔루션에 대한 궁금한 점을 해소하는 시간을 갖을 예정입니다. 이번 행사를 통해 앞으로 우리삶에 다가올 데이터분석 기술의 특별함을 현장에서 만나보세요! 무료 사전등록 하러가기(~5.3) (주)씨에스리의 부스를 방문하세요! 부스 번호 E48 부스 위치 Intelligence 바로 앞 (하단 지도 참조) 전시

Naver Blog

[개념편] t-SNE(t-distributed Stochastic Neighbor Embedding) 이것만 알고가자! - 차원축소, t-분포, 군집, PCA, 노코드 분석

안녕하세요, BigZami 입니다:) 바로 저번에! 데이터 시각화 블록에 대한 모든 포스팅을 끝마치고, 오늘부터는 신나게 데이터 분석 블록들을 알아보겠습니다. 그 스타트는 "t-SNE" 입니다. 이론부터 차근차근 보실까요? 1. t-SNE 란? [그림1] t-SNE [출처] https://datascienceplus.com/multi-dimensional-reduction-and-visualisation-with-t-sne/ t-SNE 는 T-distributed Stochastic Neighbor Embedding의 약자로, 높은 차원의 복잡한 데이터를 2차원에 차원 축소하는 방법입니다. 낮은 차원 공간의 시각화에 주로 사용하며 차원이 축소할 때는 비슷한 구조끼리 데이터를 정리한 상태이므로 데이터 구조를 이해하는 데 도움을 줍니다. 차원 축소하니 다른 블록들도 떠올려지지 않나요? 일전에 PCA, 다차원 척도법이 그랬죠! PCA, 다차원 척도법을 못 보신 분들은 아래 링크로 한번 보

Naver Blog

NLP(1) : 자연어 처리 (Natural Language Processing) 란?

written by 송진숙 1. 자연어 처리(NLP; Natural Language Processing) 란? 자연어 처리 (NLP; Natural Language Processing) [1] 분야는 인공지능의 한 분야로서 사람과 사람 간 지식, 의견, 정보 등을 전달하는 소통 수단인 언어를 컴퓨터가 이해할 수 있도록 변환하여 처리하는 분야이다. 자연어 처리 기술을 응용한 대표적인 서비스 사례로 기계 번역(Machine Translation), 챗봇(Chatbot), 문법 자동 수정, 전체 텍스트 검색, 요약(summarization) 서비스 등을 생각할 수 있다. 또는 대량의 텍스트 데이터를 분석하고 이해하는 데에도 자연어 처리가 응용된다. 회사가 고객과의 상담 내용을 텍스트 데이터로 변환한 다음 자연어 처리하여 고객의 만족 및 불만족 사유를 분석하는 것도 한 예시로 볼 수 있다. 자연어 처리에는 텍스트 인식, 음성 인식 등이 포함된다. 음성 인식(speech recognition

Naver Blog

[데이터 시각화] 혼합차트 그리기 - 보조축, 막대그래프, 라인그래프

안녕하세요, BigZami 입니다~ 드디어 시각화 블록의 마지막 포스팅입니다 새롭게 만들어진 "혼합차트" 사용법에 대해서 알아보고 가시죠! 1. 혼합 차트(콤보차트)란? [그림1] 혼합차트 예시 (in excel) 혼합차트는 유형이 다른 차트들을 한 면에 동시에 표현해내는 차트입니다. 그래프 상에 단위가 다른 두 개의 컬럼을 모두 표현하고 싶은데 단위 차이가 너무 커서 잘 나오지 않을 경우, 혼합차트의 보조축 기능을 이용하여 그리면 [그림1]처럼 보기 좋게 표현할 수 있습니다. BigZami에서는 현재 막대그래프와 라인그래프를 제공하고 있습니다. 바로 매뉴얼 부분으로 넘어가겠습니다! 2. 혼합 차트, BigZami로 해보기 BigZami에 기본적으로 내장되어 있는 mtcars 데이터를 사용하겠습니다. 따로 다운로드 받으실 필요 없습니다:) ① 데이터 불러오기 [그림1] 데이터 불러오기 [Data 파일]을 통해 샘플데이터에서 mtcars를 선택하여 불러와주세요! [그림2] 데이터 일부

Naver Blog

[업데이트] 3, 4월 빅재미 신규/추가 기능

안녕하세요 BigZami입니다 드디어 벚꽃이 흩날리는 봄이 왔네요~!! 지난번 1, 2월에 업데이트된 빅재미 기능을 알려드렸었는데요~ 봄을 맞아 3, 4월 빅재미에 추가된 기능은 애니차트의 차트종류 추가/확장과 지도그래프와 파생변수의 기능 신규 추가입니다! 새롭운 기능을들 자세히 보러 가시죠ㅎㅎ 1. 애니차트 차트유형 추가 및 기능개선 ① 차트 종류 확장(5개) [애니차트] 블록에 차트 종류로 박스플롯, 히스토그램, 바이올린 차트, 평행좌표계, 스타차트가 새롭게 추가되었습니다. [그림1] 애니차트 차트종류 추가(좌-박스플롯/우-평행좌표계) 또 좌측 컬럼 선택 그리드 필터 기능이 추가되었습니다. 데이터 타입과 컬럼명 검색을 통한 컬럼 선택이 가능합니다. [그림2] 그리드 필터 기능 추가 ② 애니차트 기능 개선 [애니차트] 블록의 다음과 같이 3가지 사항이 개선되었습니다. - X축, Y축 범위를 설정할 수 있는 기능 추가 * 레이아웃 메뉴의 "축" 탭에서 설정 가능 * X축 범위 설정

Naver Blog

[개념편] 생존분석(Survival Analysis), 이것만 알고가자! - Kaplan-Meier, Cox 비례위험모형

안녕하세요, BigZami 입니다!! 오늘은 오랜만에 시각화 기능이 아닌 분석기능에 대해 소개해드리려고 하는데요! 그 중에서도 조금 생소하실 수도 있는 "생존분석"에 대해 설명드리겠습니다. 생존분석의 개념과 다양한 분석방법까지 들으러 같이 가보실까요!! 1. 생존분석(Survival analysis)란? 생존분석이란? 사건-시간분석(Time to Event Analysis)라고 불리우며, 사건이 일어날 때까지의 시간을 대상으로 분석하는 통계 방법입니다. 또는, 시계열 분석(Time Series Analysis)이라고 부를 수도 있겠죠? 시계열 분석 개념 보러가기 [개념편] 시계열 분석, 이것만 알고가자!(추세변동, 순환변동, 계절변동, 불규칙변동) 안녕하세요! BigZami입니다. 데이터를 분석 중 중요한 기능인 '시계열 분석'을 할 때 반드시 ... blog.naver.com 주로 의학 분야에서 흔히 사용되는 방법 중 하나인데요, 환자들이 연구에 참여하는 시점에서 사건이 발생하기까

Naver Blog

[데이터 시각화] 바이올린 플롯(violin plot) 그리기 - 박스플롯, 플랫 바이올린

안녕하세요, BigZami 입니다. 오늘은 데이터 시각화 블록의 바이올린 플롯의 사용법을 알려드리겠습니다. 1. 바이올린 차트(violin plot)란? 바이올린 차트란, 데이터의 분포와 범위를 한눈에 보기 쉽게 나타내는 그래프 형식입니다. 이전에 포스팅한 박스플롯과 같은 역할을 해주는 그래프죠! (박스플롯 블록 사용 매뉴얼 보러가기) [데이터 시각화] 박스플롯(Box Plot) 그리기 - 사분위수, 상자수염그림 안녕하세요, BigZami 입니다!! 계속해서 데이터 시각화 기능을 소개해드리고 있는데요! 오늘은 그 중에서... blog.naver.com [그림1] 바이올린 차트 바이올린 분포 안에 박스플롯이 있죠? 똑같이 박스는 사분위를 의미하며 그 속 선은 중앙값을 나타냅니다. 해석하는 데 크게 어렵지 않는 그래프임으로 바로 사용 방법을 알아보겠습니다. 2. 바이올린 차트, BigZami로 해보기 가장 단순한 iris 데이터(빅재미 내장 데이터)를 가지고 바이올린 차트를 그려보겠습

Naver Blog

씨에스리, 2023 산업지능화 컨퍼런스서 노코드 분석 솔루션 '빅재미' 발표

씨에스리, 2023 산업지능화 컨퍼런스서 노코드 분석 솔루션 '빅재미' 발표 발행일 : 2023-03-14 15:00 <전혜경 씨에스리 부대표가 산업AI 분야 연사로 초청받아 노코드 솔루션 빅재미 활용 사례를 발표하고 있다.> 빅데이터·인공지능(AI) 전문기업 씨에스리(대표 이춘식)는 지난 10일 서울 코엑스에서 열린 '2023 산업지능화컨퍼런스'에서 '산업 디지털전환(DX)를 가속화시키는 노코드·로코드 솔루션 활용 전략'을 주제로 발표했다고 14일 밝혔다. 씨에스리는 컨퍼런스에서 노코드 분석 솔루션 '빅재미(BigZami)'를 소개했다. 코딩을 몰라도 인공지능(AI) 모델을 개발할 수 있는 가능성을 제시했다. 또한 데이터 분석·활용을 위해서는 코딩보다는 데이터의 가치를 찾아내는 데이터 인사이트 역량에 집중할 필요가 있다는 점을 강조했다. 빅재미는 오토머신러닝(ML)기술이 적용된 워크플로우 기반의 노코드 데이터 분석 솔루션으로 데이터 분석의 흐름을 직관적·논리적으로 설계하고 분석 템

Naver Blog

[데이터 시각화] 박스플롯(Box Plot) 그리기 - 사분위수, 상자그림

안녕하세요, BigZami 입니다!! 계속해서 데이터 시각화 기능을 소개해드리고 있는데요! 오늘은 그 중에서 박스플롯에 대해서 말씀드리려고 합니다. 박스플롯이 어디에 쓰이고 무슨 의미를 갖는지 함께 확인해보도록 하죠! 1. 박스플롯(Box Plot)이란? 박스플롯(Box Plot) 이란, 최댓값, 최솟값, 중앙값, 사분위수를 사용하여 데이터의 측정값들이 어떤 모양으로 분포되어 있으며, 이상값은 어떤지 쉽게 알 수 있도록 하는 그림입니다. 물론 integer, numeric과 같은 수치형 데이터에 적용될 수 있겠죠?? * 사분위수 : 데이터 표본을 4개의 동일한 부분으로 나눈 값 보통 많은 데이터를 눈으로 확인하기 어려울 때 이 박스플롯을 이용하여 데이터의 범위를 빠르게 확인하는 목적으로 사용됩니다. 추가적으로 이상치 존재 여부도 쉽게 확인 가능하답니다~ 2. 구성 요소 위에서 살짝 언급했듯이 박스플롯은 최댓값, 최솟값, 중앙값 그리고 사분위수들로 이루어져있는데요. 그림을 보시면 각

Naver Blog

[데이터 시각화] 워드클라우(Word Cloud) 만들기 - 텍스트 시각화

안녕하세요, BigZami 입니다. 오늘은 텍스트 분석의 대표적인 시각화 방법인 워드클라우드를 설명드리겠습니다. 바로 가보시죠! 1. 워드클라우드(Word Cloud)란? 워드클라우드란, 태그 클라우드라고도 불리우며, 문서의 키워드, 개념 등을 직관적으로 파악할 수 있도록 핵심 단어를 시각화하는 기법입니다. 많이 언급이 된 단어일수록 단어를 크게 표현하여 한눈에 들어올 수 있게 하는거죠! 주로 빅데이터를 분석할 때 데이터의 특징을 도출하거나 해당 데이터의 주요 키워드를 알아볼 때 많이 사용 합니다. [그림1] 워드클라우드 주위에서 정말 많이 사용하는 시각화 방법이라 워드클라우드를 생성하는 여러 사이트도 많은데요 저희 BigZami도 워드클라우드 기능을 제공하고 있다는 사실!! 사용 방법을 소개해드릴게요 :) 2. 워드클라우드, BigZami로 해보기 워드클라우드에 사용될 데이터는 노무현, 이명박, 박근혜 전 대통령 취임사 연설문을 모아 놓은 데이터입니다. 아래의 파일을 다운받아주세요

Naver Blog

씨에스리, '데이터바우처 지원사업' 수요기업 모집…노코드 '빅재미' 지원

씨에스리, '데이터바우처 지원사업' 수요기업 모집…노코드 '빅재미' 지원 발행일 : 2023-03-06 10:35 인공지능(AI) 기반 데이터 분석 서비스 전문기업 씨에스리(대표 이춘식)는 지난해에 이어 '2023년 데이터바우처 지원사업' 수요기업을 2년째 모집한다고 6일 밝혔다. 회사는 이달 29일까지 AI 가공 분야 수요기업을 모집한다. 모집 마감 이후 한국데이터산업진흥원(K-DATA)의 심사를 거쳐 최종 선정된 수요기업에 데이터 수집·가공 서비스를 제공할 예정이다. 지원대상은 초기 중견기업부터 중소기업, 소상공인, 예비 창업자 등이다. 수요기업으로 선정되면 오는 6~11월 6개월간 신규 서비스·제품 개발에 필요한 AI 가공 데이터 서비스를 바우처 형태로 최대 6000만원까지 지원받는 것이 가능하다. 씨에스리는 자체 개발한 노코드(No Code) 데이터 분석 툴인 빅재미(BigZami) 솔루션을 활용해 데이터 전처리, 분석, AI 모델학습, 시각화 등을 지원한다. 또 오토ML 기

Naver Blog

씨에스리, 데이터모델링 솔루션 'ERgrin' 출시

씨에스리, 데이터모델링 솔루션 'ERgrin' 출시 발행일 : 2023-01-26 00:00 <데이터모델링 솔루션 ERgrin> 씨에스리(대표 이춘식)는 데이터베이스 설계 핵심인 데이터 모델링을 쉽고 빠르게 할 수 있는 개체관계 모델링(ERD) 솔루션 'ERgrin'을 출시한다고 1일 밝혔다. 회사는 다양한 IT시스템의 데이터아키텍처·DB설계를 효과적으로 지원하기 위해 데이터 전문기업의 경험과 노하우를 집약해 솔루션을 설계했다. 더불어 기존에 많이 사용하던 외산 솔루션의 불편함을 해결하고 합리적인 비용에 제공한다. ERgrin은 오랜시간 작업 피로도의 예방을 위한 다크모드 지원 실시간 소통기반 공동작업 기능 제공 자주 사용하는 ERD 창고기능 ARC 관계 지원 ERD 뷰어 기능 엔터티와 관계가 작업화면(UI)에서 부드러우면서도 빠르게 작업할 수 있도록 기존 제품에 비해 사용자경험(UX)을 향상했다고 설명했다. 특히 공동작업형 리포지토리(저장소) 기능과 공동작업자 간 실시간 소통채널을

Naver Blog

[데이터 시각화] 지도그래프(Map Chart) 그리기2 - 위경도, 법정동코드로 지도 위에 파이차트, 막대차트, 산점도, 군집 등 표현하는 법

안녕하세요~ BigZami 입니다! 지난번 게시글에서 지도그래프에 대해 알아보았었죠? (지도그래프 블록 사용 매뉴얼 보러가기) [데이터 시각화] 지도그래프(Map Chart) 그리기 - 히트맵, 버블차트 안녕하세요~ BigZami입니다! BigZami 속에서 지도 시각화를 할 수 있는 블록이 2개 있는데요. 오늘은 ... blog.naver.com 오늘은 레이어드 기능과 시각화 차트표시가 추가된 지도그래프2를 어떻게 사용하는지 알려드릴게요! 1. 사용 가능한 데이터 형식 지도 상에서 내가 가진 데이터를 시각화할 수 있으려면, 지도와 매핑될만한 key값이 되어줄 정보가 필요합니다. 오늘 다룰 지도그래프2에서 key값이 될만한 데이터는 다음과 같습니다. ① 위경도 데이터와 법정동 코드 지도에 나타내려는 데이터 셋들은 위경도나 법정동 코드를 가지고 있어야 합니다. [그림1] 위경도 데이터와 법정동 코드 위경도의 경우, 세계에 많은 좌표계가 있는데요. 저희 BigZami에서는 4326 좌

Naver Blog

[데이터 시각화] 지도그래프(Map Chart) 그리기 - 히트맵, 버블차트

안녕하세요~ BigZami입니다! BigZami 속에서 지도 시각화를 할 수 있는 블록이 2개 있는데요. 오늘은 그 첫번째인 지도그래프를 소개해 드리려고 합니다.ㅎㅎ 이론 상으로 설명드릴 것은 없고 바로 어떻게 사용하는지 알려드릴게요! 1. 지도그래프, BigZami로 해보기 BigZami에 내장되어 있는 데이터를 사용해볼거예요~ [그림1] 2017전국교통사고 데이터 도로교통공단에서 가져온 2017년도 전국 교통사고 데이터입니다. ① 데이터 불러오기 [그림2] 데이터 정보 이 데이터로 지도 그래프를 소개시켜드리는 이유가 있습니다. 데이터를 성공적으로 불러오셨다면 위와 같은 컬럼 정보들을 보실 수 있는데요, 맨 아래에 경도, 위도 컬럼을 확인할 수 있습니다. 지도 그래프를 사용하기 위해서는 경도와 위도가 포함된 데이터를 필수적으로 사용해야합니다. 그래야 지도 상에서 표현할 수 있기 때문이죠. 데이터를 다 불러왔으면 지도 그래프로 연결하도록 하겠습니다. ② 지도 그래프 연결하기 [그림3

Naver Blog

[업데이트] 1, 2월 빅재미 신규/추가 기능

안녕하세요 BigZami입니다! 2023년에도 빅재미는 여러가지 기능을 추가하며, 사용자 맞춤형 서비스를 제공하고 있는데요ㅎ 이번에 추가된 기능은 바로바로 Test DB 기 추가와 애니차트 블록의 신규 추가입니다! 어디가 어떻게 바꼈는지 보러 가보시죠 1. DB연결 블록의 Test DB 기능 추가 대부분의 분석용 DB가 폐쇄망 내에 구축되어 있어 BigZami에서 [DB연결] 사용이 어려운 문제가 있었으나, Test DB를 통해 접근할 수 있게 되었습니다. [그림1] Test DB [테스트 가능 DB 종류] ① MariaDB ② PostgreSQL ③ Oracle 2. 문자형 변수의 상관분석 기능 기존의 [상과분석] 블록에서는 수치형(numeric, integer) 간의 상과분석 기능만 제공되었지만 업데이트 이후 문자형(factor) 간의 상관분석을 진행하고 상관계수를 얻을 수 있습니다. [사용방법] ① 좌측 상단의 "문자형" 라디오 버튼 선택 ② 데이터 타입이 factor인 컬럼들

Naver Blog

[데이터 시각화] 평행좌표 그래프(Parallel Coordinate Plot) 그리기 - 평행좌표계, 다변량 그래프

안녕하세요, BigZami 입니다!! 지난 번에 시각화 블록 중 '스타차트(Star Chart)'에 대해 알아보았는데요~ [데이터 시각화] 스타차트 그리기 - 거미줄 차트, 방사형 차트, 나이팅게일 차트 안녕하세요, BigZami입니다~ 요즘 계속 데이터 시각화 블록 매뉴얼을 포스팅하고 있는데요. 얼마 남지 않... blog.naver.com 오늘도 시각화 분석 중 하나인 "평행좌표계"에 대해서 알아보도록 하겠습니다. 1. 평행좌표 그래프(Parallel Coordinates Plot)란? [그림1] 평행좌표계 다변량 그래프 중에 하나인 평행좌표 그래프, 일명 '평행좌표계'는 각 변수를 평행으로 늘어 놓고 개별 데이터들을 선으로 이어 놓은 그래프입니다. 하나의 시각화 내에서 유형이나 크기가 전혀 다른 데이터 값을 비교하는 데 사용되어 패턴을 검사하는 용도로 유용하게 쓰이고 있습니다! 다만, 데이터가 너무 많을 경우 선들이 겹쳐 전체적인 패턴을 볼 수 없을 수도 있고 변수가 너무 많으

Naver Blog

[데이터 시각화] 스타차트 그리기 - 거미줄 차트, 방사형 차트, 나이팅게일 차트

안녕하세요, BigZami입니다~ 요즘 계속 데이터 시각화 블록 매뉴얼을 포스팅하고 있는데요. 얼마 남지 않은 데이터 시각화 블록을 차례대로 다 마친 후 데이터 분석 블록 매뉴얼에 들어가겠습니다. 혹시나, 먼저 보시고 싶은 블록이 있다면 아래의 댓글에 남겨주세요!! 그럼, 오늘은 일명 거미줄 차트 또는 거미줄 차트라고 불리는 "스타차트"에 대해서 알아보겠습니다. 1.스타차트(Star Chart)란? 스타차트는 하나의 공간에 각각의 변수를 표현하는 몇 개의 축을 그리고 축에 해당된 변수들의 값들을 연결하여 별 모양 혹은 거미줄 모양으로 표현하는 그래프 입니다. [그림1] 스타차트 하나의 변수마다 축이 시작되는 시작점(중점)은 최소값을, 가장 먼 끝점은 최대값을 나타내는데요. 값이 적은 축에 해당하는 부분이 다른 부분에 비해 들어가 보이기 때문에 여러 변수 값들을 비교하여 부족하거나 넘치는 변수를 표현하는데 아주 적합합니다. 2. 나이팅게일 차트(Nightingale Chart) Big

Naver Blog

[데이터 시각화] 히트맵(Heatmap) 차트 그리기 - 열지도, 열분포

안녕하세요, BigZami 입니다. 지난 주에 이어서 데이터 시각화 블록들 중 하나를 소개해드릴건데요~ 시각화 중에서도 사용빈도가 높은 히트맵을 들고왔습니다! 지금 바로 시작해 볼까요!! 1. 히트맵(Heatmap)이란? [그림출처] https://www.mobiinside.co.kr/2021/04/23/heatmap-chart/ [그림1] 여러가지 히트맵들 히트맵은 다양한 값을 갖는 숫자 데이터를 열분포 형태와 같이 색상을 이용해서 시각화한 것입니다. 데이터 값이 높거나 그 양이 많은 경우 진한색을, 낮거나 적은 경우 연한 색을 사용하여 시각적 패턴을 만듭니다. [그림2] 장마기간 강수량 히트맵 (기상자료개방 포털) 이 히트맵을 가장 많이 사용하는 데이터 중 하나는 바로 기상 데이터입니다. 오랜 시간에 추척된 온/습도 등 수치형 변수를 한 화면에 나타낼 수 있고, 그 과정에서 기후패턴을 찾아내는 데도 히트맵이 적절하게 쓰입니다. [그림2]는 기상자료개방포털에서 제공하는 장마기간 강

1 2 3 4 5