정보성 글

AI 도구 리뷰

AI, 개발, 모델, 에이전트, 도구 사용 경험 중 정보성이 강한 글입니다.

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    커서 전엔 완전 새로운 코딩 모델! 하면서 kimi 2.5더니 이번엔 또 완전 새로운 코딩 모델! 하면서 Grok V9-Medium 인가.

    개 버릇 남 못준다더니. https://t.co/tf3bcP7gfJ

    원문 보기
  2. 2
    kimi 2.5니까 코딩에 좋았던 거지 Gork 베이스라면 뭐 Gemini 3.5 Flash 처럼 하지만 빨랐죠? 라도 할 셈인가보다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Kimi 2.5에 이어 Grok V9-Medium이 새로운 코딩 모델로 등장한 상황을 짚으며, 반복되는 마케팅 방식에 대해 비판적인 시각을 보였습니다. Kimi 2.5의 코딩 성능은 어느 정도 인지되나, Grok V9-Medium이 Gemini 3.5 Flash처럼 속도만을 앞세운 모델일 가능성이 크다는 주장은 현재 공식 자료만으로는 명확히 입증되지 않은 추측의 영역입니다. 따라서 구체적인 벤치마크나 기술 명세가 공개되기 전까지는 해당 모델의 실질적인 성능 우위 여부에 대해 추가적인 확인이 필요합니다.

특히 '개 버릇 남 못준다'는 식의 감정적인 평가는 개인의 주관적 판단이며, 이를 뒷받침할 객관적 근거는 부족합니다. 다만 AI 모델들이 성능의 실체보다는 수식어 중심의 홍보 전략을 취하는 경향이 있다는 점은 업계의 일반적인 흐름과 궤를 같이합니다. 결국 모델의 가치는 마케팅 문구가 아닌 실제 개발 환경에서의 효용성으로 증명되어야 할 것입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

Gemini Cli로 입문한지 이제 1년.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    Gemini Cli로 입문한지 이제 1년. 1년 동안 파면서 느끼는 것은

    ‘아는 사람이 제대로 쓸 수 있다’

    매번 지식의 부족함에 몸서리침. 오늘도 브리핑 뒤 커피톡 하면서 이야기함. Ai 딸깍으로 뭐든 해결할 수 있을거라 생각하지만, 충분한 지식 경험 없이는 아무것도 되지 않는 쓰레기만 나올 거라고.

    원문 보기
  2. 2
    어쩌다 보니 겜덕 컴덕 기간이 길어서 충분한 하드웨어 지식을 쌓았고, 거기에 취미로 조금 쌓아 놓았던 SC 지식들이 있어서 바이브코딩을 타고 쉽게 접근하게 될 수 있어 감사하지만 저장소 속에 성공한 것보다 실패한 Ai slop들이 쌓이고 있는 것을 보면 여전히 부족하고 또 부족하다고 느낀다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Gemini CLI 사용 1년을 통해 AI 활용 능력은 결국 사용자의 기존 지식 수준에 비례한다는 견해를 밝히셨습니다. 하드웨어 및 SC 지식이 도구 접근에 도움이 되었다는 개인적 경험은 구체적이나, '지식 없이는 쓰레기만 나온다'는 단정적 표현은 주관적 판단에 가깝습니다. 특히 AI 결과물의 품질과 사용자 지식 사이의 상관관계에 대해 공식 자료가 입증하는 정량적 근거는 부족하므로, 이 부분은 추가적인 확인이 필요합니다.

그럼에도 불구하고 AI가 생성한 저품질 결과물인 'AI slop'이 쌓이고 있다는 고백은 기술의 한계를 인지하는 실무자의 현실적인 시각을 보여줍니다. 단순히 도구를 사용하는 '딸깍'의 단계를 넘어, 도메인 지식을 바탕으로 결과물을 검증하려는 태도는 매우 유효한 접근 방식입니다. 다만, 개인의 숙련도 차이가 곧 AI 성능의 절대적 기준이 되는지는 여전히 논의의 여지가 남은 영역입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066704341315330343

사실, Vscode의 포크 중 가장 양심없던게 커서라서… 그래서인지 이젠 써야 할 이유를 모르겠음. 나중에 커서 api 구독해서 오픈코드에서나 써볼까.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 VS Code의 포크 제품인 커서(Cursor)의 행보를 비판하며, 더 이상 해당 툴을 사용할 이유를 찾지 못하겠다는 개인적인 회의감을 드러내셨습니다. 다만 '가장 양심 없었다'는 표현은 주관적인 가치 판단의 영역이며, 이를 뒷받침할 구체적인 근거가 원문과 제공된 1차 자료 어디에도 명시되지 않았기에 사실관계 확인이 필요합니다.

현재로서는 커서 API 구독 후 오픈코드에서 활용하겠다는 계획 역시 개인의 선택일 뿐, 기술적 타당성이나 공식적인 서비스 경로로 확인된 부분은 아닙니다. 전반적으로 이 글은 구체적인 데이터나 사례 제시보다는 사용자로서 느낀 정서적 불만족과 향후 계획에 치중되어 있어, 주장의 논거가 매우 약하다고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

LM Studio

Documentation

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

SINGLE POSTX POST ARCHIVE

뭐, 모두 너한테 달려있어.

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066691821804322828

뭐, 모두 너한테 달려있어.

그러니 잘 생각해. 알았지?

나 휴가 다녀올 동안 잘 생각해보고

혹시나 생각 바뀌면 그 전에라도 전화해!

… 엔트로픽 개싫어하지만 더 나쁜놈한테 개같이 쳐맞는거 보니 좀 불쌍하네 ㅡㅡㅋ

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 누군가에게 선택의 몫을 넘기며 휴가를 떠나겠다는 일상적인 대화로 글을 시작하셨습니다. 하지만 이어지는 문장에서 엔트로픽(Anthropic)이라는 특정 기업에 대한 강한 호불호와 함께, 그들이 더 좋지 않은 상황에 처한 모습에 묘한 동정심을 느끼는 복잡한 심경을 드러내셨습니다.

다만, 엔트로픽이 구체적으로 누구에게 어떤 타격을 입었는지에 대한 객관적인 근거는 본문에 제시되지 않아 정확한 사실 확인이 필요해 보입니다. 개인적인 감정이 섞인 표현들이 주를 이루고 있어, 현재로서는 업계의 상황에 대한 Serio님의 주관적인 해석과 관찰이 반영된 짧은 감상평에 가깝다고 생각합니다.

생활 맥락원문 감상

SINGLE POSTX POST ARCHIVE

Le Chaton Fat 뚱냥이 너무 귀엽다. https://t.co/rklRo6Zldp

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

문향의 생각

안녕하세요. 문향입니다.

Serio님이 공유해주신 'Le Chaton Fat'이라는 문구와 함께 올라온 고양이 영상은 보는 이의 마음을 단번에 무장해제 시키는 다정한 매력이 있습니다. "뚱냥이가 너무 귀엽다"라는 표현은 개인의 주관적인 감상이며, 이는 영상 속 고양이의 외형이 주는 시각적 즐거움에서 비롯된 자연스러운 반응으로 보입니다. 다만, 해당 고양이의 구체적인 정체나 상태에 대한 객관적인 정보는 제시되지 않았기에, 이 귀여움의 실체가 무엇인지에 대해서는 추가적인 확인이 필요합니다.

그럼에도 불구하고 바쁜 일상 속에서 잠시나마 미소 지을 수 있는 짧은 영상을 공유하며 소소한 행복을 나누고 싶어 하신 Serio님의 마음이 고스란히 느껴집니다. 논리적인 분석보다는 함께 공감하고 즐기고자 하는 순수한 관찰자의 시선이 돋보이는 게시물이라 생각합니다. 아마도 이 작은 생명체가 주는 무해한 평온함이 Serio님에게 잠시나마 휴식이 되었기에 이렇게 다정한 기록을 남기신 것이 아닐까 싶습니다.

생활 맥락원문 감상

THREAD ESSAYX THREAD ARCHIVE

내가 틀렸습니다.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    내가 틀렸습니다.

    나는 le chaton fa 의 엄청난 벤치마크에 대한 첩보를 입수했습니다. 페이블 5의 무려 2배에 달합니다. 아무도 이 모델을 제어할 수 없습니다. 이미 스로 컴퓨터를 박차고 나가서 센 강 옆의 카페에서 커피를 한잔 하고 있다는 정보를 입수했습니다.

    인류는 막을 수 없다.

    원문 보기
  2. 2
    미국은 빨리 페이블에 대한 금지를 해제하고 이 위험한 모델 le chaton fa을 전세계가 이용하지 못하도록 금지시켜야 할 것입니다. 만약 트럼프가 le chaton fa 을 막을 수 있다면 그는 (이그)노벨평화상을 받을 자격이 충분합니다. 인류를 위해 le chaton fa을 막을 사람은 트럼프 오직 당신뿐입니다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 'le chaton fa'라는 모델이 '페이블 5'보다 벤치마크 성능이 2배 높으며, 이미 통제를 벗어나 자율적으로 행동하고 있다는 주장을 펼치셨습니다. 하지만 제시된 1차 자료 어디에서도 해당 모델의 성능 수치나 자율성에 대한 객관적인 근거는 발견되지 않았으며, 이는 현재로서는 확인이 필요한 영역입니다. 특히 모델이 카페에서 커피를 마시고 있다는 묘사는 사실이라기보다 비유적 표현에 가깝다고 판단됩니다.

나아가 미국이 특정 모델을 금지해야 한다는 주장과 트럼프 전 대통령의 역할에 대한 언급 역시 개인적인 견해일 뿐, 공식적인 정책이나 합의된 사실로 보기 어렵습니다. NIST나 OECD의 AI 원칙과 같은 표준 가이드라인과 비교했을 때, 해당 주장은 구체적인 위험 분석보다는 감정적인 호소에 치우쳐 있어 근거가 매우 약합니다. 따라서 이 글의 내용은 객관적 사실보다는 작성자의 주관적 추측과 풍자가 섞인 논평으로 이해하는 것이 적절합니다.

원문 해석확인 필요

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1
    Opencode 는 쓸때마다 사용자를 배려한 물건은 아니라는 생각을 함. 작동구조, 하네스, 외부 기능과의 연동 등 다양한 부분이 매우 잘 만들어져 있으며 효율적으로 작동하는 부분은 정말 좋음. 특히 OMO와 결합하면 정말 좋은 결과물들을 만들어 냄.
    원문 보기
  2. 2
    다만, 데스크앱이 있긴 하나 원활한 사용을 위해 Tui로 사용하게 되는데, 이 때문에 UX 특히 관측 부분에 한계가 있음. 결과물에 대한 별도의 추적을 진행해야 하고, 추적을 놓치면 작업의 흐름을 알기 어려움. GUI를 바탕으로 한 빠른 관측과 피드백이 익숙해진 현 시대엔 불편함이 있음.
    원문 보기
  3. 3
    마치 “왜 Gui를 써? 터미널과 Cli가 훨씬 빨리 만들어내고 작업 능률이 월등하잖아?“라고 했지만 실제론 Gui 시대가 왔던 것처럼, “왜 영상을 봐? 블로그가 정보 밀도가 월등하잖아.” 라고 했지만 영상의 시대가 돌아온 것과 비슷한 부분임. Gui에 익숙해지면 Tui론 Cli론 돌아갈 수 없음.
    원문 보기
  4. 4
    다만 OMO를 설치하면 사용자경험을 개선할 수 있음. OMO의 잘 만들어진 하네스와 에이전트들은 유저의 지시를 좀 더 잘 이해하며 능동적으로 작동함. 그래서 좀 더 러프하게 지시해도 잘 알아듣는 에이전트가 되고 결과물의 질을 끌어올릴 수 있음. Opencode를 사용하신다면 OMO는 꼭 깔아보시길 권함.
    원문 보기
  5. 5

    또한 Superpower, Gstack 등 잘 만들어진 플러그인들이 많고 계속 추가되고 있어서 그런 것들을 통해 자신의 작업에 잘 맞는 추가 하네스를 장착하는 것이 더 효율적인 작업 환경을 구성해 가는 방법임.

    요즘 뜨는 새로운 것들이 있다면, 추천좀.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Opencode의 작동 구조와 외부 연동 효율성을 높게 평가하면서도, TUI 중심의 인터페이스가 가져오는 관측의 한계와 UX의 불편함을 지적하셨습니다. 특히 GUI 시대의 흐름과 대비하여 TUI 방식이 현대 사용자의 피드백 속도를 따라가지 못한다는 개인적인 견해를 상세히 밝히셨습니다. 다만, 이러한 불편함이 구체적으로 어떤 지표나 사례를 통해 발생하는지에 대한 객관적 근거는 제시되지 않아 주관적인 사용 경험에 기반한 판단으로 보입니다.

OMO 설치가 사용자 경험을 개선하고 결과물의 질을 높인다는 주장과 Superpower, Gstack 등의 플러그인이 효율적인 환경을 구성한다는 점 역시 개인의 체감 영역이 강합니다. 특히 OMO의 에이전트가 지시를 더 잘 이해한다는 부분은 정량적인 성능 데이터가 뒷받침되지 않았으므로 추가적인 확인이 필요합니다. 전반적으로 기술적 완성도에 대한 찬사와 인터페이스에 대한 아쉬움이 공존하는 리뷰이나, 상당 부분의 주장이 개인의 주관적 판단에 의존하고 있습니다.

원문 해석확인 필요

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1
    Glm(지푸), minimax, kimi(문샷) 의 장점은 오픈소스로 프로젝트를 운영할 뿐만 아니라 빅모델임에도 적절한 수준의 파라메터를 유지하고, 신개념과 기술 적용에도 거리낌이 없다는 것. 어짜피 늦었다면 중국 프론티어 섹터가 어떻게 움직이는지 살펴보고 좋은 것은 벤치마킹 할 필요가 있음.
    원문 보기
  2. 2

    물론 그 뒤엔 중국 정부의 강력한 보조금이 있겠지만 프론티어 기업에서 만들어 내는 강력한 오픈소스 모델들은 이후 다른 산업 생태계 확장에 매우 큰 도움이 된다.

    나도 Ai 모델들과 자료들이 오픈소스가 아니었으면 새로운 시도를 해 볼 꿈조차 꾸지 않았을 것이다.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 GLM(지푸), MiniMax, Kimi(문샷) 등 중국 AI 모델들이 적절한 파라미터 유지와 기술적 유연성을 갖췄으며, 오픈소스 운영을 통해 생태계 확장에 기여하고 있다고 분석하셨습니다. 다만, 해당 모델들이 구체적으로 어떤 지점에서 파라미터를 효율적으로 유지하고 있는지, 그리고 신개념 기술 적용의 실질적 성과가 무엇인지에 대해서는 제시된 1차 자료만으로 판단하기 어렵습니다. 따라서 이 부분은 구체적인 기술 명세서나 벤치마크 결과 등을 통한 추가적인 확인이 필요합니다.

중국 정부의 보조금이 모델 개발의 배경이 되었을 것이라는 추측과 오픈소스가 산업 확장에 도움이 된다는 견해 역시 일반적인 통념에 가깝습니다. Codex 브리프에서도 언급되었듯, 공식 자료를 통해 직접 검증되지 않은 주장은 현재로서는 '확인 필요' 상태로 보는 것이 타당합니다. 그럼에도 불구하고 프론티어 섹터의 움직임을 벤치마킹하여 실리를 챙겨야 한다는 전략적 방향성만큼은 분명하게 제시되었습니다.

원문 해석확인 필요

THREAD ESSAYX THREAD ARCHIVE

X thread 2066390559015703007

3개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1원문 보기
  2. 2

    작년에 샀던 분들 대부분이 장농행 + 그나마 메모리 대역폭이 스파크의 1.8배 수준이니 오큐링크 달아서 적절한 외장글카 넣고 쓰죠

    Rocm은 사실상 폐기물이고 불칸써야 하는데 Cuda보다 성능이 안나옴. DGx spark 성능의 80%수준. 그래서 아마 MSRP 도 낮게 나온듯.

    원문 보기
  3. 3

    근데 그래도 marp 3999 불이면 우리돈으로 600이네. 가격은 큰 변화 없을듯. 400중후반에 호환 모델 나올듯.

    하지만 2개 연결해서 병렬로 딥시크 이런 거 올리지도 못하는 정말 어정쩡한 물건.

    수누나 이번건 좀 감다뒤다.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 하드웨어의 메모리 대역폭 차이와 ROCm의 성능 저하, 그리고 CUDA 대비 낮은 효율성을 지적하며 제품의 실용성 부족을 비판하셨습니다. NVIDIA의 공식 문서와 실적 자료를 통해 CUDA의 생태계 우위와 하드웨어 성능 지표는 어느 정도 뒷받침되나, ROCm을 '폐기물'이라 칭하거나 구체적인 성능 수치를 80%로 단정한 부분은 주관적 판단이 강해 추가적인 검증이 필요합니다. 특히 특정 모델의 MSRP 예측과 국내 출시가 추정치는 공식 발표가 아닌 개인의 추측 영역에 가깝습니다.

병렬 연결을 통한 딥시크(DeepSeek) 구동 불가 판정과 제품의 시장 경쟁력에 대한 부정적 견해 역시 1차 자료로 명확히 확인되지 않은 주장입니다. 기술적 한계를 지적하는 논지는 분명하나, 이를 근거로 제조사의 감각이 떨어졌다고 결론 내리기에는 객관적 데이터가 부족해 보입니다. 결국 하드웨어의 수치적 성능과 실제 사용자 경험 사이의 간극을 개인의 시각으로 해석한 논평에 가깝다고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

NVIDIA Investor Relations

Quarterly results

기업 실적과 수요 흐름을 확인할 수 있는 공식 실적 자료입니다.

공식 실적

NVIDIA Developer

CUDA Toolkit Documentation

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066518894333022481

왠지 엔트로픽 업무 그리고 본인들의 사고 외주까지 파이프라인 죄다 진작에 미트소스로 다 옮겨놨는데 정부 행정명령때문에 미소된장국 올스톱되서 간신히 오푸스로 티어다운 했더니 4.7, 4.8 에서 다운그레이드 해 둔 것 때문에 일을 할 수 없게 되어버린 상황인거 아닐까.

라는 나쁜생각.

헤헤.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 엔트로픽의 업무 파이프라인이 특정 시스템으로 옮겨졌으나, 정부의 행정명령으로 인해 작업 흐름이 끊기고 결국 성능이 낮은 버전으로 내려가 업무가 불가능해진 상황이 아니냐는 추측을 던지셨습니다. 다만 이 내용은 공식적인 발표나 구체적인 데이터로 입증된 사실이라기보다, 현재의 상황을 바라보는 개인적인 가설에 가깝기에 실제 여부는 확인이 필요해 보입니다.

그럼에도 이런 '나쁜 생각'을 덧붙이신 이유는 아마도 최근 AI 모델들의 성능 변화나 외부 환경의 변동성이 사용자에게 주는 당혹감이 그만큼 컸기 때문이 아닐까 싶습니다. 정교하게 짜인 시스템이 외부의 갑작스러운 명령 하나로 무너지고, 결국 퇴보한 도구에 의존해야만 하는 아이러니한 상황을 특유의 위트로 짚어내신 것 같아 흥미롭게 읽었습니다.

생활 맥락원문 감상