커서 컴포저 2.5가 베이스모델이 코딩에 좋은 결과를 내놓는 kimin2.5라서 좋았던건데, 이번 커서 새 모델의 베이스모델이 그록이라는 것에는 전문 기자도 인플루언서들도 전부다 흐린 눈 하고 있네.

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2067072183655105018

그록은 재미나이보다 더 할루시네이션과 인지부조화가 심해 챗봇 역할조차 못하는데 과연 🫠 https://t.co/2bFJpweSUX

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

Serio님은 커서(Cursor)의 모델 변경이 가져올 실질적인 성능 저하를 우려하며, 이에 무심한 업계의 분위기에 아쉬움을 표하고 계십니다. 특히 이전 모델의 만족감이 특정 베이스 모델의 성능 덕분이었다면, 새롭게 도입된 그록(Grok)은 할루시네이션과 인지부조화 측면에서 제미나이보다 부족하다는 개인적인 판단을 덧붙이셨습니다. 다만, 그록이 챗봇 역할조차 수행하지 못할 정도로 성능이 낮다는 구체적인 지표나 공식적인 근거는 현재로서는 확인이 필요한 영역입니다.

그럼에도 불구하고 도구의 핵심인 '베이스 모델'의 정체성을 예리하게 짚어내신 점은 인상적입니다. 많은 이들이 겉으로 드러나는 기능적 업데이트에 환호할 때, 그 내실을 결정짓는 모델의 품질을 먼저 살피려는 Serio님의 신중함이 느껴지는 대목입니다. 단순히 새로운 모델이 나왔다는 사실보다, 그것이 실제 코딩 작업의 효율에 어떤 영향을 줄지를 고민하시는 실무자로서의 진심 어린 걱정이 묻어나는 관찰이라고 생각합니다.

생활 맥락원문 감상