[바이브코딩] PDF2html - 편집 스타일, 문단/줄 정

생활코딩/AI를 이용한 코딩

[바이브코딩] PDF2html - 편집 스타일, 문단/줄 정

내.맘.대.로 2026. 3. 4. 10:14

http://jikji.duckdns.org:8085/cloud/pdf2html_demo.zip

전자책 제작자가 코딩만 하네요 ^^;

hello world 정도 만드는 수준의 코딩 실력으로 AI를 이용해 만든 앱입니다.

이 앱은 PDF를 EPUB으로 편집하기 위한 XHTML 파일로 변환합니다.

아직 만드는 중이라 PDF 10쪽만 변환하도록 기능을 제한했습니다.

인터넷 찾아 보면 PDF를 EPUB으로 변환해 주는 웹서비스나 앱도 많은데 왜 이런 앱이 필요해? 라고 하시는 분도 많을거예요.

네. 그런 앱이 좋다면 그 앱을 사용하시면 됩니다.

이 앱은 PDF를 EPUB으로 만들어 출간을해야 하는 출판계에 계신 분들을 위한 앱입니다.

뿐만 아니라 PDF 원고를 html로 저장 후 hwp로 불러와 편집을 할 수 있습니다.

원고 없이 PDF로 보관하고 있는데 개정판 등을 내기 위해 재편집을 해야 할 때 유용합니다.

너무나 당연한 얘기지만,

이미지 PDF나 아웃라인 PDF는 사용 할 수 없습니다. 이런 PDF는 OCR을 이용하세요.

이 앱의 특징은,

1. PDF의 글자 편집 스타일을 그대로 유지해 준다.

- 글꼴, 글자크기, 색상, 첨자, 기울임, 진하게 등의 기본 스타일을 그대로 유지합니다.

- 추출하고 싶은 스타일을 직접 지정 할 수 있습니다.

2. 문단/줄 정리

- PDF에서 텍스트를 추출 할 때 가장 큰 문제가 문단이 잘리는 문제가 있습니다.

다 자란 새들이 둥지를 떠나듯 성장한 자녀는 부모를 떠난
다. 의심의 여지는 추호도 없는, 유구한 본능이며 당연한 사
실이다. 생애 이벤트(교육, 연애, 취업, 결혼, 출산 등)를 거치면
서 아이는 어른이, 자녀는 부모가 된다. 그런데 오늘날 이
현상은 사뭇 달라졌다. 아들딸이 집을 떠나지 않거나, 나갔
다가 되돌아온 경우가 급격히 늘어난 것이다.

이렇게 잘린 문단을 정리해야 하는데, 정리를 하면 이런 문제가 생기지요.

다 자란 새들이 둥지를 떠나듯 성장한 자녀는 부모를 떠난 다. 의심의 여지는 추호도 없는, 유구한 본능이며 당연한 사 실이다. 생애 이벤트(교육, 연애, 취업, 결혼, 출산 등)를 거치면 서 아이는 어른이, 자녀는 부모가 된다. 그런데 오늘날 이 현상은 사뭇 달라졌다. 아들딸이 집을 떠나지 않거나, 나갔 다가 되돌아온 경우가 급격히 늘어난 것이다.

이렇게 잘린 줄이 신국판 300쪽 기준으로 3000개 ~ 5000개 정도 나옵니다.

제가 표시를 해서 눈에 잘 보이지만, 저런 부분은 찾아 정리하려면 시간이 오래 걸려요.

이런 문단을 정리해 줍니다.

3. 일괄 처리

PDF 한두개라면, 시간 들여 하나씩 정리하면됩니다. 그런데 10개, 20개를 정리하려면 시간이 많이 걸리지요?

여러개의 PDF를 일괄로 처리하는 일괄 처리 기능을 추가했습니다.

일괄 처리는 PDF를 HTML로 추출, 문단 정리, LLM 정리를 알아서 진행합니다.

**사용 방법**

1. 앱을 실행하세요.

(윈도우에서 강제로 Xbox Game Bar(ms-gamingoverlay)를 띄우려고 시도하는데, 이걸 막는 방법을 찾지 못했어요. 이와 관련한 메시지가 뜨면, 무시하면 됩니다.)