HWP/HWPX 문서를 읽거나 Markdown·HTML로 변환합니다. Claude에게 말로 부탁하면 됩니다 — “이 HWP 파일 읽어줘”, “한글 문서 마크다운으로 바꿔줘”처럼요.
빠른 시작
이 HWP 파일 읽어줘
한글 문서를 마크다운으로 변환해줘
서식 그대로 HTML로 변환해줘
스킬이 자동으로 변환 도구를 찾아 실행합니다. 이미지가 있으면 추출은 하지만 이미지 설명(캡션)은 기본적으로 달지 않습니다 — 필요하면 “이미지 설명도 달아줘”를 덧붙이세요.
활용 시나리오
LLM이 바로 읽을 수 있는 Markdown 만들기
공공기관·기업 HWP 문서를 LLM이 이해하기 쉬운 Markdown으로 정리합니다. 레이아웃용으로 쓰인 표는 자동으로 불릿·들여쓰기 리스트로 평탄화됩니다.
이 보고서를 마크다운으로 변환해줘
서식을 보존한 HTML로 전달
표·정렬·색상 등 원본 서식을 유지하면서 브라우저에서 바로 열 수 있는 단일 HTML 파일이 필요할 때 사용합니다. 이미지는 파일 안에 내장되어 파일 하나로 완결됩니다.
HWP를 HTML로 변환해줘. 서식 그대로
HWP5 변환 실패 시 HTML 우회
HWP5(.hwp) 포맷은 제목 자동 감지·하이퍼링크 추출이 지원되지 않습니다. MD 변환 품질이 떨어지면 HTML로 변환한 뒤 Claude가 다시 Markdown으로 재가공하는 경로를 쓸 수 있습니다.
이 HWP가 MD로 이상하게 변환됐어. HTML로 우회해줘
이미지 처리 방식
| 이렇게 말하면 | 동작 |
|---|---|
| (별다른 말 없음, 기본) | 이미지 추출 O, 이미지 설명(캡션) X |
| ”본문만”, “텍스트만”, “이미지 빼고”, “이미지 없이” | 이미지 추출 X, 캡션 X — 가장 가볍습니다 |
| ”이미지 설명도”, “캡션 포함”, “이미지 분석해줘” | 이미지 추출 O, 캡션 O — 이미지가 본문 이해에 핵심일 때 |
이 보도자료 본문만 마크다운으로 뽑아줘
이 보고서 변환할 때 이미지 설명도 달아줘
이미지가 10개를 초과하면 캡션을 생성하기 전에 범위를 확인합니다(전체·처음 N개·건너뛰기).
표 처리 방식
한국 공공기관 문서는 레이아웃 목적으로 표를 많이 씁니다. Markdown 변환 결과에서 레이아웃용 표는 자동으로 불릿·들여쓰기 리스트로 평탄화합니다.
표 구조를 그대로 유지하고 싶으면 “원본 그대로”, “테이블 유지”, “표 형식으로 보여줘”를 말하세요.
이 문서 원본 그대로 표 형식으로 변환해줘
팁
- 표 형식 유지: 비교표·교차분석표처럼 행-열 교차가 핵심 정보인 경우 “원본 그대로”, “테이블 유지”를 말하면 평탄화를 건너뛰고 Markdown 테이블을 유지합니다.
- HTML 우회: HWP5 변환 결과가
??로 깨지거나 제목이 유실되면 “HTML로 변환해줘”라고 말하세요. HWPX(.hwpx) 포맷이 가능하다면 그쪽이 훨씬 안정적입니다. - “이미지 설명 없이”·“캡션 없이”: 과거 버전과의 호환을 위해 인식하지만 기본 동작과 같습니다.
제한사항
| 항목 | 내용 |
|---|---|
| 쓰기 미지원 | Markdown → HWPX, HWP/HWPX 수정은 지원하지 않습니다. 읽기·변환 단방향 전용입니다. |
| HWP5 포맷 제약 | 제목 자동 감지·하이퍼링크 추출·Wingdings 특수문자가 지원되지 않습니다. 가능하면 HWPX(.hwpx)를 사용하세요. |
| 수식·차트 OLE 객체 | 수식(수학식)·차트 등 OLE 기반 객체는 추출되지 않습니다. 학술 문서·계산 리포트는 내용 일부가 유실될 수 있습니다. |
| 기타 포맷 미지원 | PDF, DOCX, XLSX 등 HWP/HWPX가 아닌 포맷은 처리하지 않습니다. 다른 스킬(pdf-context-refinery 등)을 사용하세요. |
| 암호 보호 파일 | 비밀번호로 보호된 HWP/HWPX는 변환할 수 없습니다. 먼저 암호를 해제한 뒤 요청해야 합니다. |
| 바이너리 요구 | hwpx CLI v0.9.7 이상이 필요합니다. Linux(Cowork)는 자동으로 준비되지만 macOS/Windows는 PATH에 설치되어 있어야 합니다. |