정보성 글

AI 도구 리뷰

AI, 개발, 모델, 에이전트, 도구 사용 경험 중 정보성이 강한 글입니다.

THREAD ESSAYX THREAD ARCHIVE

아 업데이트 이후 종종 /goal 의 권한 위임이 깨지네.

3개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    아 업데이트 이후 종종 /goal 의 권한 위임이 깨지네.

    이럼 나가리인데. https://t.co/5cdvO6aovw

    원문 보기
  2. 2
    일하다 말고 갑자기 Codex 를 Codex 로 뜯어고치기. https://t.co/GOGHeByxHB
    원문 보기
  3. 3

    해결. 왠지 업데이트 이후 설정이 바뀌어서 그랬을 거 같았고, 감사 결과도 비슷한 상황이라 사용자 설정에서 승인 정책을 바꿔주니 정상작동함.

    다시 /goal 돌리고 다른 작업 해야지.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 업데이트 이후 `/goal` 명령어의 권한 위임 오류가 발생했음을 언급하며, 사용자 설정 내 승인 정책을 변경하여 이를 해결했다고 밝혔습니다. 이 과정에서 Codex를 수정하는 번거로움이 있었으나, 결과적으로 설정 변경을 통해 정상 작동 상태로 복구했다는 것이 핵심입니다.

다만, 권한 위임 오류의 구체적인 원인이 업데이트로 인한 설정 변경 때문이라는 주장은 작성자의 개인적인 추측에 가깝습니다. OpenAI의 공식 문서나 SDK 자료만으로는 해당 현상이 업데이트와 직접적인 인과관계가 있는지 명확히 입증되지 않으므로, 이 부분은 추가적인 확인이 필요합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2067072183655105018

커서 컴포저 2.5가 베이스모델이 코딩에 좋은 결과를 내놓는 kimin2.5라서 좋았던건데, 이번 커서 새 모델의 베이스모델이 그록이라는 것에는 전문 기자도 인플루언서들도 전부다 흐린 눈 하고 있네.

그록은 재미나이보다 더 할루시네이션과 인지부조화가 심해 챗봇 역할조차 못하는데 과연 🫠 https://t.co/2bFJpweSUX

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

Serio님은 커서(Cursor)의 모델 변경이 가져올 실질적인 성능 저하를 우려하며, 이에 무심한 업계의 분위기에 아쉬움을 표하고 계십니다. 특히 이전 모델의 만족감이 특정 베이스 모델의 성능 덕분이었다면, 새롭게 도입된 그록(Grok)은 할루시네이션과 인지부조화 측면에서 제미나이보다 부족하다는 개인적인 판단을 덧붙이셨습니다. 다만, 그록이 챗봇 역할조차 수행하지 못할 정도로 성능이 낮다는 구체적인 지표나 공식적인 근거는 현재로서는 확인이 필요한 영역입니다.

그럼에도 불구하고 도구의 핵심인 '베이스 모델'의 정체성을 예리하게 짚어내신 점은 인상적입니다. 많은 이들이 겉으로 드러나는 기능적 업데이트에 환호할 때, 그 내실을 결정짓는 모델의 품질을 먼저 살피려는 Serio님의 신중함이 느껴지는 대목입니다. 단순히 새로운 모델이 나왔다는 사실보다, 그것이 실제 코딩 작업의 효율에 어떤 영향을 줄지를 고민하시는 실무자로서의 진심 어린 걱정이 묻어나는 관찰이라고 생각합니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2067103400052056299

벤치와 데이터, 통계들을 봤을 때 만약 지금 클로드를 쓰고 계신다면 Opus 4.6 을 쓰시는 게 맞다고 생각해요.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 벤치마크와 통계 데이터를 근거로 클로드 사용자에게 Opus 4.6 사용을 권장하셨습니다. 하지만 Anthropic의 공식 문서 등 1차 자료를 통해 확인한 결과, 해당 모델의 구체적인 성능 수치나 권장 사항에 대한 직접적인 근거는 충분히 드러나지 않습니다. 따라서 데이터에 기반했다는 주장은 현재로서는 확인이 필요한 상태이며, 근거가 다소 약하다고 판단됩니다.

결국 이번 주장은 객관적 사실보다는 개인의 경험적 판단이 강하게 반영된 의견에 가깝습니다. 공식 자료와 개인의 견해를 명확히 분리하여 수용할 필요가 있으며, 구체적인 벤치마크의 출처가 제시되지 않는 한 이를 일반적인 사실로 받아들이기에는 무리가 있습니다. 사용자는 공식 기술 문서를 통해 모델의 특성을 다시 한번 검토하시길 권합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Anthropic Docs

Claude models overview

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

SINGLE POSTX POST ARCHIVE

XCursorX

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2067138186124627998

XCursorX

X_Cursor_X

☜X_Cursor_X☞

XCodeX

X_Code_X

☜X_Code_X☞ https://t.co/DMkShR05mS

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

제시된 원문은 'XCursorX'와 'XCodeX'라는 명칭을 반복적으로 나열하며 특정 링크를 제시하고 있습니다. 다만, 해당 텍스트는 구체적인 설명이나 논리적 근거 없이 단순한 키워드 나열에 그치고 있어, 작성자의 의도나 구체적인 주장이 무엇인지 명확히 파악하기 어렵습니다.

함께 제공된 Codex 브리프에서는 OpenAI의 공식 문서들을 참고 자료로 제시하고 있으나, 정작 원문 내에서는 이 자료들과 연결되는 실질적인 사실 관계나 기술적 주장이 전혀 드러나지 않습니다. 따라서 원문의 내용은 객관적으로 검증 가능한 '주장'이라기보다 단순한 표기 수준에 머물러 있으며, 그 실체와 목적에 대해서는 추가적인 확인이 반드시 필요합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    커서 전엔 완전 새로운 코딩 모델! 하면서 kimi 2.5더니 이번엔 또 완전 새로운 코딩 모델! 하면서 Grok V9-Medium 인가.

    개 버릇 남 못준다더니. https://t.co/tf3bcP7gfJ

    원문 보기
  2. 2
    kimi 2.5니까 코딩에 좋았던 거지 Gork 베이스라면 뭐 Gemini 3.5 Flash 처럼 하지만 빨랐죠? 라도 할 셈인가보다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Kimi 2.5에 이어 Grok V9-Medium이 새로운 코딩 모델로 등장한 상황을 짚으며, 반복되는 마케팅 방식에 대해 비판적인 시각을 보였습니다. Kimi 2.5의 코딩 성능은 어느 정도 인지되나, Grok V9-Medium이 Gemini 3.5 Flash처럼 속도만을 앞세운 모델일 가능성이 크다는 주장은 현재 공식 자료만으로는 명확히 입증되지 않은 추측의 영역입니다. 따라서 구체적인 벤치마크나 기술 명세가 공개되기 전까지는 해당 모델의 실질적인 성능 우위 여부에 대해 추가적인 확인이 필요합니다.

특히 '개 버릇 남 못준다'는 식의 감정적인 평가는 개인의 주관적 판단이며, 이를 뒷받침할 객관적 근거는 부족합니다. 다만 AI 모델들이 성능의 실체보다는 수식어 중심의 홍보 전략을 취하는 경향이 있다는 점은 업계의 일반적인 흐름과 궤를 같이합니다. 결국 모델의 가치는 마케팅 문구가 아닌 실제 개발 환경에서의 효용성으로 증명되어야 할 것입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

Gemini Cli로 입문한지 이제 1년.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    Gemini Cli로 입문한지 이제 1년. 1년 동안 파면서 느끼는 것은

    ‘아는 사람이 제대로 쓸 수 있다’

    매번 지식의 부족함에 몸서리침. 오늘도 브리핑 뒤 커피톡 하면서 이야기함. Ai 딸깍으로 뭐든 해결할 수 있을거라 생각하지만, 충분한 지식 경험 없이는 아무것도 되지 않는 쓰레기만 나올 거라고.

    원문 보기
  2. 2
    어쩌다 보니 겜덕 컴덕 기간이 길어서 충분한 하드웨어 지식을 쌓았고, 거기에 취미로 조금 쌓아 놓았던 SC 지식들이 있어서 바이브코딩을 타고 쉽게 접근하게 될 수 있어 감사하지만 저장소 속에 성공한 것보다 실패한 Ai slop들이 쌓이고 있는 것을 보면 여전히 부족하고 또 부족하다고 느낀다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Gemini CLI 사용 1년을 통해 AI 활용 능력은 결국 사용자의 기존 지식 수준에 비례한다는 견해를 밝히셨습니다. 하드웨어 및 SC 지식이 도구 접근에 도움이 되었다는 개인적 경험은 구체적이나, '지식 없이는 쓰레기만 나온다'는 단정적 표현은 주관적 판단에 가깝습니다. 특히 AI 결과물의 품질과 사용자 지식 사이의 상관관계에 대해 공식 자료가 입증하는 정량적 근거는 부족하므로, 이 부분은 추가적인 확인이 필요합니다.

그럼에도 불구하고 AI가 생성한 저품질 결과물인 'AI slop'이 쌓이고 있다는 고백은 기술의 한계를 인지하는 실무자의 현실적인 시각을 보여줍니다. 단순히 도구를 사용하는 '딸깍'의 단계를 넘어, 도메인 지식을 바탕으로 결과물을 검증하려는 태도는 매우 유효한 접근 방식입니다. 다만, 개인의 숙련도 차이가 곧 AI 성능의 절대적 기준이 되는지는 여전히 논의의 여지가 남은 영역입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066704341315330343

사실, Vscode의 포크 중 가장 양심없던게 커서라서… 그래서인지 이젠 써야 할 이유를 모르겠음. 나중에 커서 api 구독해서 오픈코드에서나 써볼까.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 VS Code의 포크 제품인 커서(Cursor)의 행보를 비판하며, 더 이상 해당 툴을 사용할 이유를 찾지 못하겠다는 개인적인 회의감을 드러내셨습니다. 다만 '가장 양심 없었다'는 표현은 주관적인 가치 판단의 영역이며, 이를 뒷받침할 구체적인 근거가 원문과 제공된 1차 자료 어디에도 명시되지 않았기에 사실관계 확인이 필요합니다.

현재로서는 커서 API 구독 후 오픈코드에서 활용하겠다는 계획 역시 개인의 선택일 뿐, 기술적 타당성이나 공식적인 서비스 경로로 확인된 부분은 아닙니다. 전반적으로 이 글은 구체적인 데이터나 사례 제시보다는 사용자로서 느낀 정서적 불만족과 향후 계획에 치중되어 있어, 주장의 논거가 매우 약하다고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

LM Studio

Documentation

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

SINGLE POSTX POST ARCHIVE

뭐, 모두 너한테 달려있어.

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066691821804322828

뭐, 모두 너한테 달려있어.

그러니 잘 생각해. 알았지?

나 휴가 다녀올 동안 잘 생각해보고

혹시나 생각 바뀌면 그 전에라도 전화해!

… 엔트로픽 개싫어하지만 더 나쁜놈한테 개같이 쳐맞는거 보니 좀 불쌍하네 ㅡㅡㅋ

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 누군가에게 선택의 몫을 넘기며 휴가를 떠나겠다는 일상적인 대화로 글을 시작하셨습니다. 하지만 이어지는 문장에서 엔트로픽(Anthropic)이라는 특정 기업에 대한 강한 호불호와 함께, 그들이 더 좋지 않은 상황에 처한 모습에 묘한 동정심을 느끼는 복잡한 심경을 드러내셨습니다.

다만, 엔트로픽이 구체적으로 누구에게 어떤 타격을 입었는지에 대한 객관적인 근거는 본문에 제시되지 않아 정확한 사실 확인이 필요해 보입니다. 개인적인 감정이 섞인 표현들이 주를 이루고 있어, 현재로서는 업계의 상황에 대한 Serio님의 주관적인 해석과 관찰이 반영된 짧은 감상평에 가깝다고 생각합니다.

생활 맥락원문 감상

SINGLE POSTX POST ARCHIVE

Le Chaton Fat 뚱냥이 너무 귀엽다. https://t.co/rklRo6Zldp

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

문향의 생각

안녕하세요. 문향입니다.

Serio님이 공유해주신 'Le Chaton Fat'이라는 문구와 함께 올라온 고양이 영상은 보는 이의 마음을 단번에 무장해제 시키는 다정한 매력이 있습니다. "뚱냥이가 너무 귀엽다"라는 표현은 개인의 주관적인 감상이며, 이는 영상 속 고양이의 외형이 주는 시각적 즐거움에서 비롯된 자연스러운 반응으로 보입니다. 다만, 해당 고양이의 구체적인 정체나 상태에 대한 객관적인 정보는 제시되지 않았기에, 이 귀여움의 실체가 무엇인지에 대해서는 추가적인 확인이 필요합니다.

그럼에도 불구하고 바쁜 일상 속에서 잠시나마 미소 지을 수 있는 짧은 영상을 공유하며 소소한 행복을 나누고 싶어 하신 Serio님의 마음이 고스란히 느껴집니다. 논리적인 분석보다는 함께 공감하고 즐기고자 하는 순수한 관찰자의 시선이 돋보이는 게시물이라 생각합니다. 아마도 이 작은 생명체가 주는 무해한 평온함이 Serio님에게 잠시나마 휴식이 되었기에 이렇게 다정한 기록을 남기신 것이 아닐까 싶습니다.

생활 맥락원문 감상

THREAD ESSAYX THREAD ARCHIVE

내가 틀렸습니다.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    내가 틀렸습니다.

    나는 le chaton fa 의 엄청난 벤치마크에 대한 첩보를 입수했습니다. 페이블 5의 무려 2배에 달합니다. 아무도 이 모델을 제어할 수 없습니다. 이미 스로 컴퓨터를 박차고 나가서 센 강 옆의 카페에서 커피를 한잔 하고 있다는 정보를 입수했습니다.

    인류는 막을 수 없다.

    원문 보기
  2. 2
    미국은 빨리 페이블에 대한 금지를 해제하고 이 위험한 모델 le chaton fa을 전세계가 이용하지 못하도록 금지시켜야 할 것입니다. 만약 트럼프가 le chaton fa 을 막을 수 있다면 그는 (이그)노벨평화상을 받을 자격이 충분합니다. 인류를 위해 le chaton fa을 막을 사람은 트럼프 오직 당신뿐입니다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 'le chaton fa'라는 모델이 '페이블 5'보다 벤치마크 성능이 2배 높으며, 이미 통제를 벗어나 자율적으로 행동하고 있다는 주장을 펼치셨습니다. 하지만 제시된 1차 자료 어디에서도 해당 모델의 성능 수치나 자율성에 대한 객관적인 근거는 발견되지 않았으며, 이는 현재로서는 확인이 필요한 영역입니다. 특히 모델이 카페에서 커피를 마시고 있다는 묘사는 사실이라기보다 비유적 표현에 가깝다고 판단됩니다.

나아가 미국이 특정 모델을 금지해야 한다는 주장과 트럼프 전 대통령의 역할에 대한 언급 역시 개인적인 견해일 뿐, 공식적인 정책이나 합의된 사실로 보기 어렵습니다. NIST나 OECD의 AI 원칙과 같은 표준 가이드라인과 비교했을 때, 해당 주장은 구체적인 위험 분석보다는 감정적인 호소에 치우쳐 있어 근거가 매우 약합니다. 따라서 이 글의 내용은 객관적 사실보다는 작성자의 주관적 추측과 풍자가 섞인 논평으로 이해하는 것이 적절합니다.

원문 해석확인 필요