3일동안 실험한 pdf to markdown파싱 구조로 업계 1황이라는 MinerU랑 붙여 보았다.

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

1
3일동안 실험한 pdf to markdown파싱 구조로 업계 1황이라는 MinerU랑 붙여 보았다.
인공지능은 MinerU가 설계구조가 더 낫다고 하면서도 전제를 달았다.
‘Ai agent가 읽는다고 하면 우리게 낫습니다. 왜냐면 MinerU는 구조적 해석과 추출을 전제로 하고 있어서요.’
공개해볼까?
원문 보기
2
MinerU의 분석모델은 낮은 파라메터로도 효율적 작업이 가능한 우수한 모델이지만, 거기에 너무 집중한 나머지 종종 굉장히 복잡한 문서를 만나면 아예 분석을 못하고 결과물이 완전히 망가져버리는 구조 붕괴 현상이 발생하는 것 또한 관측했다.
원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 직접 설계한 PDF 파싱 구조가 AI 에이전트 활용 측면에서 MinerU보다 우위에 있다고 주장하며, MinerU가 복잡한 문서에서 구조 붕괴 현상을 일으킨다고 분석했습니다. 하지만 제시된 1차 자료들은 일반적인 에이전트 SDK나 개요 수준의 문서일 뿐, 특정 모델 간의 파싱 성능을 직접 비교 검증한 데이터는 포함되어 있지 않습니다. 따라서 MinerU의 구조적 결함이나 특정 상황에서의 성능 저하 주장은 객관적 지표가 결여된 개인적 관측치에 가까우며, 정밀한 교차 검증이 필요한 상태입니다.

그럼에도 불구하고 '구조적 해석'과 '에이전트 최적화'라는 접근 방식의 차이를 지적한 점은 기술적으로 유의미한 관점입니다. 다만, 인공지능의 답변을 근거로 본인의 구조가 더 낫다고 판단한 것은 주관적 해석의 영역이며, 이를 일반화하기에는 근거가 약합니다. 결과적으로 해당 주장이 설득력을 얻으려면 단순한 비교 언급이 아니라, 구체적인 벤치마크 데이터나 실패 사례에 대한 정량적 분석이 수반되어야 할 것으로 보입니다.

원문 해석확인 필요