스킬.잇다
itda-data/data-analysis-advisor 실험적 v1.3.0

빠른 시작

CSV 파일이나 숫자 데이터를 보여주고 분석 방법을 물어보면 됩니다.

이 매출 데이터 어떻게 분석해?
불량률과 공정 온도 사이에 관계가 있는지 봐줘
고객 이탈 원인 찾아줘
이 데이터로 회귀분석 가능해?

스킬이 데이터를 읽고, 분석 가능 여부를 판단한 뒤, 적합한 기법을 추천하거나 이유를 설명하며 거부합니다.

이런 분석에 씁니다

  • 데이터 상태 파악 — 어떤 열이 숫자인지, 빈 값은 얼마나 있는지, 튀는 값은 없는지
  • 분석 방법 추천 — 회귀분석·분산분석·시계열·탐색적 분석 중 데이터에 맞는 기법
  • 현업 검증 기법 안내 — 파레토(주요 원인 추리기)·관리도(공정 안정성)·RFM(고객 분류)
  • 거부 사유 설명 — 데이터가 부족하거나 인과관계 증명이 불가능할 때, 왜 안 되는지 알려줌

데이터 전달 방법

CSV 파일 경로 알려주기

sales_2024.csv 파일 분석해줘

데이터를 직접 붙여넣기

아래 데이터 분석해줘

제품명,매출,수량
사과,1000,10
배,2000,20
감,3000,30

결정 맥락 같이 알려주기

분석 목적을 함께 말하면 더 정확한 추천을 받습니다.

다음 달 재고 발주 결정을 위해 이 데이터를 분석하고 싶어

인터뷰 단계

스킬은 데이터를 받으면 두 가지를 먼저 확인합니다.

  1. 어떤 결정을 내리려고 하는가 — 목적 없는 분석은 더 위험한 결론을 냅니다
  2. 인과관계가 필요한가 — 단순 패턴 파악인지, 원인-결과를 증명해야 하는지

두 질문에 답해야 분석이 진행됩니다. 답하지 않으면 진행이 차단됩니다.

거부 결과를 받았다면

스킬이 분석을 거부했다면 아래를 확인하세요.

데이터가 너무 적어서 거부

  • 5개 미만: 너무 적어서 어떤 통계 결론도 신뢰할 수 없습니다. 데이터를 더 모으는 것 외에 방법이 없습니다.
  • 30개 미만: 정확한 수치는 어렵지만 추세 방향은 볼 수 있습니다. 아래처럼 물어보세요.
정확한 수치 말고 방향만 봐도 될까?

변수들이 너무 비슷해서 거부 (다중공선성)

분석에 쓸 항목들이 서로 거의 같은 정보를 담고 있으면 결과가 뒤틀립니다. 비슷한 항목 하나를 빼고 다시 요청하세요.

비슷한 항목 하나를 빼고 다시 분석해줘

”원인-결과” 증명까지는 못한다고 거부

“A가 B의 원인”이라고 결론 내리려면 비교 그룹·무작위 추출 같은 설계가 필요합니다. 단순 관측 데이터로는 “같이 움직인다” 정도까지만 말할 수 있습니다. 그 정도면 충분하다면 아래처럼 요청하세요.

원인이라고 단정하지 말고, 같이 움직이는 패턴만 봐줘

분석은 안 되더라도 데이터 현황은 보고 싶을 때

거부가 나와도 데이터가 어떻게 생겼는지 살펴보는 건 거의 항상 가능합니다.

분석은 안 되더라도 데이터 현황만 요약해줘

비정돈 파일인 경우

헤더가 2행이거나 소계 행이 섞여 있으면 분석 전에 정돈이 필요합니다.

이 파일은 좀 지저분한데 먼저 정리해줄 수 있어?

→ data-tidy-advisor 스킬로 연결됩니다.

결과 해석 방법

분석이 끝나면 두 가지를 받습니다.

  • 판정 결과 — 분석이 가능한지(채택), 조심해서 봐야 하는지(회색지대), 왜 안 되는지(거부) 알려줍니다.
  • 분석 보고서 — 실제 수치와 함께 “어디까지 믿을 수 있는가”에 대한 주의사항을 같이 적어둡니다.

보고서에 ⚠️ 주의 표시가 있으면 결론을 100% 확신하지 말고 추가 데이터 수집을 고려하세요.

결과 화면 예시

판정: 채택 (회귀분석)
- 표본 수: 86건 (충분)
- 결정계수 R²: 0.74
⚠️ 주의: 7월 데이터 1건이 이상값입니다. 해당 행을 빼면 R²는 0.81로 올라갑니다.

자주 묻는 질문

Q. 파일을 어디서 읽나요? 지금 작업 중인 폴더에 있는 파일이면 파일 이름만 말해도 됩니다. 다른 폴더의 파일은 전체 경로를 알려주세요.

Q. 엑셀 파일도 되나요? 바로는 안 되고, data-tidy-advisor 스킬로 먼저 정돈한 뒤 넘기면 됩니다. “이 엑셀 분석해줘”라고 하면 자동으로 정돈 단계를 거칩니다.

Q. 어떤 분석 기법을 추천하나요? 데이터 구조와 인터뷰 결과에 맞춰 회귀분석·탐색적 분석(EDA)·파레토·관리도·RFM·분산분석 중 적합한 것을 제안합니다.

Q. 별도 설치나 키 발급이 필요한가요? 아닙니다. 설치·회원가입·API 키 모두 필요 없이 바로 씁니다.