본문으로 건너뛰기
yutils
예시

입력 (PPTX + 모드)

파일: deck-q2.pptx (24 슬라이드)
모드: markdown (슬라이드별 헤딩)

출력 (Markdown)

# 슬라이드 1

## yutils 2026 Q2 로드맵
발표자: jade · 2026-05-13

# 슬라이드 2

## 핵심 지표
- MAU: 12k → 25k
- 도구 수: 55 → 70
- 평균 체류: 3분 12초
...

참고

PPTX 는 XML 기반 ZIP 이라 텍스트 추출이 비교적 정확합니다. 다만 이미지·차트·도형 안의 텍스트는 표현 한계로 누락될 수 있어요.

사용법 / 자주 묻는 질문

이런 경우 사용하세요

  • 발표 자료 PPTX 를 마크다운 문서로 변환 (블로그 · 회고)
  • 기획안 · 보고서 PPT 의 텍스트만 골라내 검색 가능 형태로
  • AI 프롬프트 입력용으로 PPTX 콘텐츠 발췌
  • 장표 내용을 노션 · 위키에 옮길 때
  • 발표 자료를 다국어 번역할 때 원문 텍스트 추출

자주 묻는 질문

Q.키노트(.key) 파일도 가능한가요?
A.아닙니다 — PPTX(.pptx) 만 지원. Keynote 는 자체 포맷이라 추출 방식이 완전히 다릅니다. Keynote 에서 PPTX 로 내보낸 다음 시도하세요.
Q.차트 데이터 · 표 안 텍스트는?
A.기본 표는 cell 텍스트 그대로 추출됩니다. 차트(Excel 임베드)의 데이터 라벨은 일부 누락 가능. 도형·다이어그램 안 텍스트는 보통 추출 OK.
Q.발표 노트(speaker notes)는?
A.현재는 슬라이드 본문만 추출 — speaker notes 는 별도 옵션으로 추가 검토 중. 필요하면 PPTX 안 notesSlide XML 을 직접 파싱하는 방법이 있어요.
재미있는 사실
  • .pptx 는 사실 ZIP 압축된 폴더 — 파일 확장자를 .zip 으로 바꾸고 열어보면 ppt/slides/slide1.xml, slide2.xml ... 가 들어있음. 자체 binary 가 아니라 OOXML (Office Open XML) 표준의 ZIP container.

    Wikipedia — OOXML
  • PPTX 표준 (ECMA-376) 은 2006 년 표준화, ISO/IEC 29500 으로 2008 년 국제 표준. Microsoft Office 2007+ 가 default 로 사용. 옛 .ppt (binary) 와 완전히 다른 포맷.

    ECMA-376
  • PPTX 의 슬라이드 XML 은 <a:p> (paragraph) + <a:r> (run) + <a:t> (text) 의 중첩. 같은 단락이 여러 run 으로 쪼개진 게 흔함 — 폰트·색이 바뀌면 run 분리. 그래서 단순 텍스트 추출은 모든 <a:t> 만 합치면 됨.

    Microsoft — OpenXml Drawing