예시
입력 (PPTX + 모드)
파일: deck-q2.pptx (24 슬라이드) 모드: markdown (슬라이드별 헤딩)
출력 (Markdown)
# 슬라이드 1 ## yutils 2026 Q2 로드맵 발표자: jade · 2026-05-13 # 슬라이드 2 ## 핵심 지표 - MAU: 12k → 25k - 도구 수: 55 → 70 - 평균 체류: 3분 12초 ...
참고
PPTX 는 XML 기반 ZIP 이라 텍스트 추출이 비교적 정확합니다. 다만 이미지·차트·도형 안의 텍스트는 표현 한계로 누락될 수 있어요.
사용법 / 자주 묻는 질문
이런 경우 사용하세요
- 발표 자료 PPTX 를 마크다운 문서로 변환 (블로그 · 회고)
- 기획안 · 보고서 PPT 의 텍스트만 골라내 검색 가능 형태로
- AI 프롬프트 입력용으로 PPTX 콘텐츠 발췌
- 장표 내용을 노션 · 위키에 옮길 때
- 발표 자료를 다국어 번역할 때 원문 텍스트 추출
자주 묻는 질문
- Q.키노트(.key) 파일도 가능한가요?
- A.아닙니다 — PPTX(.pptx) 만 지원. Keynote 는 자체 포맷이라 추출 방식이 완전히 다릅니다. Keynote 에서 PPTX 로 내보낸 다음 시도하세요.
- Q.차트 데이터 · 표 안 텍스트는?
- A.기본 표는 cell 텍스트 그대로 추출됩니다. 차트(Excel 임베드)의 데이터 라벨은 일부 누락 가능. 도형·다이어그램 안 텍스트는 보통 추출 OK.
- Q.발표 노트(speaker notes)는?
- A.현재는 슬라이드 본문만 추출 — speaker notes 는 별도 옵션으로 추가 검토 중. 필요하면 PPTX 안 notesSlide XML 을 직접 파싱하는 방법이 있어요.
재미있는 사실
.pptx 는 사실 ZIP 압축된 폴더 — 파일 확장자를 .zip 으로 바꾸고 열어보면 ppt/slides/slide1.xml, slide2.xml ... 가 들어있음. 자체 binary 가 아니라 OOXML (Office Open XML) 표준의 ZIP container.
Wikipedia — OOXMLPPTX 표준 (ECMA-376) 은 2006 년 표준화, ISO/IEC 29500 으로 2008 년 국제 표준. Microsoft Office 2007+ 가 default 로 사용. 옛 .ppt (binary) 와 완전히 다른 포맷.
ECMA-376PPTX 의 슬라이드 XML 은 <a:p> (paragraph) + <a:r> (run) + <a:t> (text) 의 중첩. 같은 단락이 여러 run 으로 쪼개진 게 흔함 — 폰트·색이 바뀌면 run 분리. 그래서 단순 텍스트 추출은 모든 <a:t> 만 합치면 됨.
Microsoft — OpenXml Drawing
관련 도구
- JSON 포매터 / 검증기
JSON 문자열을 포맷팅·검증·압축합니다. 들여쓰기 조정과 키 정렬 옵션이 있으며, 브라우저에서 즉시 실행됩니다.
- 문자열 케이스 변환
문자열을 camelCase·PascalCase·snake_case·kebab-case·CONSTANT_CASE·Title Case 6개 형태로 동시에 변환해 보여줍니다.
- 정규식 테스터
JavaScript 정규식을 실시간으로 테스트합니다. g/i/m/s/u/y 플래그와 캡처 그룹을 지원합니다.
- Markdown 프리뷰
Markdown을 HTML로 렌더링하여 좌·우로 비교 표시합니다. CommonMark + GFM(테이블·코드 펜스·태스크 리스트) 지원.
- HTML → Markdown
HTML을 Markdown으로 변환합니다. 헤딩·리스트·링크·코드·표·인용 지원. 브라우저 DOMParser 사용 — 정확하고 0 dependency.
- YAML ↔ JSON 변환
YAML과 JSON을 양방향 변환합니다. YAML 측의 주석·멀티라인 문자열을 허용합니다.
- 텍스트 비교
두 텍스트를 줄·단어·문자 단위로 비교하고 추가/삭제를 강조합니다.
- JSON 비교
두 JSON을 정렬·정규화 후 비교, 변경점을 강조합니다. 잘못된 JSON 에러 안내 포함.
- CSV ↔ JSON
CSV와 JSON을 상호 변환합니다. 쿼팅·구분자·헤더 행을 지원합니다.
- SQL 포매터
SQL 쿼리를 들여쓰기·키워드 케이스에 맞게 포매팅합니다. PostgreSQL/MySQL/SQLite/Standard 지원.
- XML 포매터
XML을 보기 좋게 포매팅하거나 압축합니다. SOAP·sitemap·설정 파일에 적합.
- XML ↔ JSON
XML과 JSON을 상호 변환합니다. 속성과 요소 표기를 모두 지원합니다.
- 스마트 붙여넣기
어떤 텍스트든 붙여넣으면 적합한 도구를 추천합니다 — JSON·JWT·Base64·URL·UUID·Cron 등 15종 자동 감지.
- 로렘 입숨 생성기
더미 텍스트를 단어·문장·문단 단위로 생성합니다. 정통 Lorem Ipsum 또는 랜덤.
- JSON Path 추출기
JSONPath 표현식($.store.book[*].author 등)으로 JSON에서 값을 추출합니다.
- JSON Schema 검증기
JSON 데이터를 JSON Schema(Draft 2020-12)로 검증합니다. Ajv + format 검증 지원.
- JSON Schema 생성기
샘플 JSON에서 JSON Schema(Draft 2020-12)를 자동 생성합니다. 타입·필수 필드·중첩 구조 추론.
- HTML 포매터
HTML을 보기 좋게 들여쓰기·압축·속성 정렬합니다.
- CSS 포매터
CSS를 들여쓰기·압축합니다. 셀렉터·속성 스타일 옵션.
- JavaScript 포매터
JavaScript를 들여쓰기·압축합니다. 중괄호 스타일/들여쓰기 옵션.
- TOML ↔ JSON
TOML과 JSON을 상호 변환합니다. Cargo.toml, pyproject.toml 등 설정 파일에 자주 사용.
- INI ↔ JSON
INI 설정 파일을 JSON으로 변환합니다. [section]·주석(;/#)·key=value 지원.
- JSON → TypeScript
JSON 샘플로 TypeScript interface를 생성합니다. 중첩 객체는 별도 interface로 분리.
- JS Object → JSON
JavaScript 객체 리터럴(따옴표 없는 키, 작은따옴표, trailing comma, 주석)을 표준 JSON 으로 변환합니다. 관대한 파서, 엄격한 출력.
- Slug 생성기
텍스트를 URL-safe slug으로 변환합니다. 구분자/대소문자/악센트 제거 옵션.
- ASCII 트리
들여쓰기 또는 경로 목록을 box-drawing 트리(├── │ └──)로 변환합니다.
- Diff 패치
두 텍스트로부터 unified diff(-u) 패치를 생성합니다. `git apply` / `patch -p0` 호환.
- Mock 데이터 생성기
이름·이메일·커스텀 필드·UUID·날짜 등 가짜 JSON 레코드와 SQL INSERT seed 데이터를 생성합니다. 외부 의존 없음.
- MongoDB Extended JSON
MongoDB Extended JSON(EJSON)을 Canonical ↔ Relaxed 양방향 변환하거나, BSON wrapper를 제거해 일반 JSON으로 만듭니다. 16종 wrapper 인식 ($oid/$date/$numberLong/$numberDecimal/$binary/…).
- Kubernetes YAML 시각화
Kubernetes 매니페스트를 붙여넣으면 리소스 그래프를 그립니다. Deployment·Service·Ingress·ConfigMap·Secret·PVC 의 연결을 한눈에. yaml 라이브러리는 lazy import.
- Docker Compose 시각화
docker-compose.yml 을 붙여넣으면 서비스·네트워크·볼륨·depends_on 을 인터랙티브 그래프로 그립니다. 100% 브라우저 처리, yaml 라이브러리는 lazy import.
- PDF 텍스트 추출
PDF 파일에서 텍스트를 추출합니다. 페이지별 또는 전체 합쳐서. 마크다운 호환 출력, 브라우저에서만 처리.
- 정규식 다이어그램
정규식을 railroad 다이어그램으로 시각화. 분기·그룹·반복을 한눈에 — 브라우저에서.
- 글자수 세기
글자수(공백 포함/제외)·단어·문장·문단·줄·바이트 수를 실시간으로 세어줍니다. 자소서·리포트 분량 확인까지 브라우저에서 바로.
- 토큰 계산기 (LLM)
LLM 토큰 수와 비용을 계산합니다. GPT는 정확(tiktoken), Claude/Gemini는 추정. 컨텍스트 한도 게이지. 브라우저에서 바로.