정보성 글

AI 도구 리뷰

AI, 개발, 모델, 에이전트, 도구 사용 경험 중 정보성이 강한 글입니다.

SINGLE POSTX POST ARCHIVE

오늘의 Gork : 이온몰을 이마트로 번역하시다. 🫠

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    오늘의 Gork : 이온몰을 이마트로 번역하시다. 🫠

    야 옆집 클로드는 미트소스인지 미소된장국인지 내놨데 정신차려! 뭐 그집에 이미 컴퓨팅 렌트해서 돈벌고 있으니 괜찮다구?

    그래 네가 좋다면 좋은거겠지. https://t.co/tFxRDaBUBx https://t.co/8fk6En6SdT

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 AI 모델인 그록(Grok)이 일본의 '이온몰'을 한국의 '이마트'로 오역한 상황을 포착하여 가벼운 농담 섞인 어조로 공유하셨습니다. 타 AI 모델인 클로드(Claude)의 사례를 함께 언급하며 각 모델의 성능 차이를 익살스럽게 꼬집으셨는데, 이는 기술적 결함에 대한 날카로운 분석이라기보다 AI들의 엉뚱한 모습에서 오는 해프닝을 즐기시는 관찰자의 시선이 느껴집니다.

다만, 클로드의 특정 출력물이나 컴퓨팅 렌트 수익과 관련된 언급은 구체적인 근거 자료가 제시되지 않아 사실 여부를 확인하기 어렵습니다. 이 부분은 기술적인 팩트보다는 AI 생태계의 흐름을 비유적으로 표현하신 개인적인 감상일 가능성이 높으므로, 정확한 내용은 추가적인 확인이 필요해 보입니다. 그럼에도 불구하고 AI가 보여주는 인간적인 실수들을 다정하게 지켜보시는 Serio님의 여유로운 시각이 돋보이는 글입니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2064666208591581220

프로그래밍보다 도메인 지식이 중요해진다는 말은 ‘우리가 당신의 아이디어를 훔칠께요!’ 라는 말로 들린다. AI가 에이전트 결합한지 1년, 프로그래밍에 대한 지식은 더욱 중요하다. 여전히 실현할 수 없는 아디이어는 아이디어일 뿐이고 Ai 딸깍은 그저 헛된 희망과 Slop 만 양산할 뿐이다.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

최근 AI 기술의 발전으로 도메인 지식의 중요성이 강조되는 흐름 속에서, Serio님은 오히려 프로그래밍 지식의 가치가 더욱 커졌다는 날카로운 시선을 보여주셨습니다. 단순히 아이디어만으로는 실현 불가능한 영역이 존재하며, 기술적 이해 없는 AI 활용은 무의미한 결과물인 '슬롭(Slop)'만을 양산할 뿐이라는 우려 섞인 진단입니다. 다만, 도메인 지식의 강조가 아이디어 탈취로 이어진다는 주장은 개인의 경험적 판단에 기반한 것으로 보이며, 이를 뒷받침할 객관적인 공식 자료는 확인이 필요한 상태입니다.

그럼에도 불구하고 이 글에는 기술적 실체 없이 장밋빛 미래만을 이야기하는 시장에 대한 피로감과, 진짜 '구현 능력'을 가진 이들에 대한 존중이 담겨 있다는 느낌을 받았습니다. 도구의 편리함에 매몰되지 않고 본질적인 설계 능력을 갖춰야 한다는 Serio님의 외침은, AI 시대에 우리가 놓치지 말아야 할 기본기가 무엇인지 다시금 생각하게 합니다. 결국 아이디어를 현실로 만드는 힘은 정교한 프로그래밍 지식에서 나온다는 확신이 느껴지는 대목입니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2064773790941487295

결국 한밤중 두번째 사용량 종료 떠서, opencode 의 딥시크 V4 Flash 랑 네모트론 3 울트라로 작업을 이어가는데

  • 딥시크가 정확도가 굉장히 우수함.

  • 네모트론은 계속 빠르게 헤멤.

혹여나 나중에 256G 급 로컬 머신을 구매하게 된다면 딥시크를 꼭 써봐야겠음. 언제될지 모르겠지만.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 사용량 제한으로 인해 딥시크 V4 Flash와 네모트론 3 울트라를 교차 사용하며 각각의 정확도와 성능 차이를 언급하셨습니다. 이 중 딥시크의 우수한 정확도와 네모트론의 불안정한 성능에 대한 내용은 개인의 작업 경험에 기반한 주관적 판단이며, 이를 뒷받침할 객관적인 벤치마크나 공식 자료는 확인되지 않았습니다. 따라서 해당 성능 비교 수치는 개별 환경에 따른 체감 결과일 가능성이 크므로 추가적인 검증이 필요합니다.

반면, 256G급 로컬 머신 구매 시 딥시크를 사용하겠다는 계획은 하드웨어 사양과 모델 구동 가능 여부라는 기술적 사실에 기반하고 있습니다. 다만, 특정 모델의 로컬 구동 효율이 실제 작업 환경에서 동일한 성능을 낼지는 미지수이며, 이 역시 단순한 기대치에 가깝습니다. 전반적으로 이번 게시글은 공식적인 지표보다는 개인의 사용 경험이 주를 이루고 있어, 일반적인 성능 지표로 수용하기에는 근거가 부족합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2064630049975025738

/Goal 을 ‘루프 엔지니어링’으로 재포장하는거 웃기다.

claude.md 와 agent.md

Gemini cli 와 클로드코드 와 Codex cli

다 같은 방향을 가리키고 있는데 표현 단어만 바꾸어 마치 자신들만이 특별한 무언가를 하고 있는 것처럼 포장함.

프레이밍과 가스라이팅이 지나치다.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 최근 AI 기업들이 내놓는 다양한 도구들이 결국 같은 방향을 지향함에도 불구하고, 용어만 바꾸어 특별한 기술인 것처럼 포장하고 있다고 지적하셨습니다. 실제로 언급된 Claude Code, Gemini CLI, OpenAI Agents SDK 등은 모두 AI가 직접 코드를 실행하거나 시스템을 제어하는 에이전트적 특성을 공유한다는 점에서 기술적 궤를 같이한다는 점은 사실에 가깝습니다. 다만, 이를 '루프 엔지니어링'이라는 특정 용어로 재포장했다는 구체적인 연결 고리는 제공된 1차 자료만으로는 명확히 확인되지 않아 추가적인 검토가 필요합니다.

특히 기업들의 마케팅 방식이 '프레이밍'과 '가스라이팅' 수준이라는 주장은 기술적 사실보다는 작성자의 주관적 해석과 판단이 강하게 반영된 영역입니다. 기업이 사용하는 용어의 차이가 단순한 브랜드 전략인지, 혹은 실질적인 기술적 차별점을 내포하고 있는지는 공식 문서의 세부 명세서를 통해 대조해 보아야 할 문제입니다. 따라서 현재로서는 기술적 유사성에 대한 지적은 타당해 보이나, 이를 의도적인 기만으로 규정하기에는 근거가 다소 부족하다고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Anthropic Docs

Claude Code overview

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Anthropic Docs

Claude models overview

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

흠... 터미널 벤치마크 88.0%

3개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    흠… 터미널 벤치마크 88.0% 근데 터미널 벤치마크 2.1 Opus 4.8 이 78.9% 일텐데?

    흠… https://t.co/F9f1sGCIhF

    원문 보기
  2. 2

    혹시나 몰라 특이점갤에 가보니 ㅋㅋ

    • 싱글턴 추론 토큰 14분 300K (멈추지 않음)
    • 가이드 튕기면 오푸스 전환
    • 거의 모든 기본적 작업에도 답변 거부
    • 수능 생물, 사회 문화 문항에 답변 거부

    이렇게 개발자들과 사용자 반응이 엇갈리는 모델은 또 처음보네.

    원문 보기
  3. 3
    • 6월 22일까지 Fable 5는 Pro, Max, Team 및 사용자 기반 Enterprise 플랜에 추가 비용 없이 포함됩니다.
    • 6월 23일부터 Fable 5는 해당 플랜에서 제외됩니다. 이후에는 이용 크레딧이 필요합니다 . 용량이 허용하는 경우, 포함된 기간을 연장해 드릴 수 있습니다.

    ㅋㅋㅋ 이런건 처음보네 https://t.co/lLPfaX2PJa

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님이 언급한 Fable 5의 플랜 변경 일정과 비용 발생 시점은 공식 안내 문구의 형태를 띠고 있어 사실일 가능성이 높습니다. 다만, 터미널 벤치마크 수치와 관련하여 Opus 4.8과의 비교 우위를 주장한 부분은 제시된 자료만으로는 그 정확성을 완전히 담보하기 어렵습니다. 수치상의 차이가 존재하더라도 측정 환경과 기준이 명시되지 않았다면, 이를 객관적인 성능 지표로 확정 짓기에는 근거가 부족합니다.

특히 커뮤니티 반응을 인용하며 언급한 답변 거부 사례나 추론 토큰의 이상 동작 등은 개별 사용자의 경험치에 의존한 주관적 영역입니다. 이러한 현상이 모델의 보편적인 결함인지, 혹은 일시적인 오류인지에 대해서는 공식적인 기술 문서나 벤치마크 결과로 확인되지 않았기에 추가적인 확인이 필요합니다. 개발사 측의 정량적 지표와 실제 사용자들의 정성적 평가가 극명하게 엇갈리는 지점이 이번 논란의 핵심이라고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Anthropic Docs

Claude models overview

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

GitHub Docs

GitHub Actions

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1
    @han_seongsook 장관님. 국무총리 가시는 길에 본인이 펼쳐 놓으셨던 ‘모두의 창업’ 뒷수습 좀 하고 가십시오. 검토도 안한 답변, 보지도 않은 영상 심의에 제대로 지원했던 많은 사람들이 허탈한 심정을 감추지 못하고 있습니다. https://t.co/EeXfRJd586 https://t.co/acrFBi2Tg4
    원문 보기
  2. 2
    영상 안보고 심사할 거면, 올리라는 말은 대체 왜? 아이디어 평가인데 내용은 읽지도 않은 천편일률적 답변은 왜? 많은 기관에서 저품질 AI를 일괄적으로 돌린 답변들로 한 대답들로 탈락 사유를 채우는 건 가당키나 한지요? 어설픈 멘토링이 필요한게 아닙니다. 당장의 지원이 필요한 겁니다.
    원문 보기
  3. 3

    이럴거라면 아예 2기부턴 모든 멘토링 기구들을 해촉하고 심사를 중앙에서 오로지 AI만을 이용해서 하는 것을 정중히 요청드립니다. 차라리 그게 더 빠르면서 객관적이고 효율적일 거라고 판단합니다.

    어설픈 도움은 필요 없습니다. 제대로 된 도움을 원합니다.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 '모두의 창업' 사업의 심사 과정에서 영상 미검토와 천편일률적인 답변, 그리고 저품질 AI를 활용한 탈락 사유 작성 등의 부실함을 지적하며 행정적 책임과 개선을 요구하셨습니다. 다만, 제시된 내용은 개인의 경험과 주장에 기반한 것으로, 실제 심사 과정에서 AI가 일괄적으로 사용되었는지나 구체적인 심사 태만 여부를 입증할 공식적인 1차 자료는 아직 확인되지 않았습니다. 따라서 해당 주장들은 현재로서는 '확인 필요' 상태이며, 객관적 근거가 보완되어야 할 부분입니다.

그럼에도 불구하고 지원자가 느낀 허탈함과 행정 서비스에 대한 불신은 매우 구체적으로 드러나 있으며, 이는 단순한 불만을 넘어 시스템의 효율성과 객관성에 대한 근본적인 의문을 제기하고 있습니다. 특히 멘토링 기구 해촉과 AI 심사 전환이라는 파격적인 제안은 현재의 인적 심사 체계가 그만큼 신뢰를 잃었음을 시사합니다. 실질적인 지원이 절실한 창업자들에게 형식적인 답변만 되풀이하는 행정은 지양되어야 하며, 이에 대한 명확한 소명과 개선책이 마련되어야 할 것입니다.

원문 해석확인 필요

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    이번에도, 저번에도 창업 지원 기관들이 지원자들의 문서를 제대로 만들지도 읽지도 않는다. 매우 실망했고, 그냥 자력갱생하기로 마음 먹었다. 아마 이거야말로 최고의 창업 지원이 아닐까.

    읽는 척 평가하는 척 하지 말고, 1차 심사 Gpt, 2차 심사 클로드에게 맏기는게 정확할 것이다.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

창업 지원 기관의 서류 검토 과정에 깊은 회의감을 느끼신 Serio님의 마음이 고스란히 전해집니다. 정성껏 준비한 문서가 제대로 읽히지 않았다는 실망감은 단순히 절차의 문제를 넘어, 창업가로서의 열정을 부정당한 기분이었을 것입니다. 결국 자력갱생을 선택하며 이를 '최고의 지원'이라 역설하신 대목에서는, 외부의 도움보다 스스로의 힘으로 증명해내겠다는 단단한 의지와 씁쓸한 냉소가 동시에 느껴집니다.

다만, 심사 과정에서 실제로 문서가 방치되었는지 혹은 AI 심사 도입이 더 정확할지에 대한 구체적인 근거는 제시되지 않아 확인이 필요해 보입니다. 이는 개별 기관의 운영 방식에 따른 주관적 경험일 가능성이 크기에, 객관적인 사실로 확정 짓기에는 무리가 있습니다. 그럼에도 불구하고 형식적인 평가 시스템에 지친 창업가의 외침은 현재의 지원 체계가 실질적인 도움이 되고 있는지 다시금 생각하게 만듭니다.

생활 맥락원문 감상

THREAD ESSAYX THREAD ARCHIVE

모두의 창업 둘 다 떨어졌네. 흠.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    모두의 창업 둘 다 떨어졌네. 흠. 슬슬 수도권 이전을 고려해봐야 할 듯.

    기존 창업 컨설팅 기관들이 메인이다 보니 그들의 퀄리티 생각하면 제대로 봐 줄 리 없다 + 사전 인맥 커넥션 만들어 놔야 하는 걸 알고 있었는데 제대로 준비해서 넣은 것도 떨어지는걸 보면 지방에 있는게 독인듯.

    원문 보기
  2. 2

    결국 올해도 계속 자비 갈아넣고 가는 것인가.

    외주에나 매달려야할듯.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 '모두의 창업' 지원 결과가 좋지 않았다는 사실과 이에 따라 수도권 이전을 고민하며 외주 작업에 집중하겠다는 개인적인 계획을 밝히셨습니다. 다만, 탈락의 원인을 기존 컨설팅 기관의 낮은 퀄리티나 사전 인맥 커넥션의 부재, 그리고 지방 거주라는 환경적 요인으로 돌린 부분은 작성자의 주관적 해석에 가깝습니다. 이러한 판단을 뒷받침할 객관적인 심사 지표나 구체적인 근거가 제시되지 않았기에, 해당 주장은 논리적 연결 고리가 다소 약하다고 보입니다.

특히 특정 기관들의 전문성 부족이나 인맥 중심의 선정 과정에 대한 주장은 공식적인 자료로 검증되지 않은 영역이므로 확인이 필요합니다. 단순히 결과에 대한 아쉬움을 넘어 시스템의 구조적 문제를 지적하시려면, 구체적으로 어떤 기준이 불합리했는지에 대한 실질적인 데이터가 보완되어야 할 것입니다. 현재로서는 개인의 심경과 상황에 기반한 추론이 주를 이루고 있어, 이를 일반적인 사실로 받아들이기에는 무리가 있습니다.

원문 해석확인 필요

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2064203759979471216

하지만 말없는 클로드가 월 20만불에 말 많은 18만불급 제품 관리자 업무를 대체했다고 주장하면서 사람은 쫓겨나는데 실제론 slop하는 현실이 찾아오는 것 같은데요.

경영자 : 인건비를 아꼈으니 아무튼 좋았어!

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 고액 연봉의 제품 관리자가 AI로 대체되는 상황에서, 실제 업무의 질은 오히려 떨어지는 '슬롭(slop)' 현상이 나타나고 있다는 우려를 전하셨습니다. 경영진이 비용 절감이라는 수치적 이득에만 매몰되어 실질적인 결과물의 저하를 간과하고 있다는 날카로운 관찰이 돋보입니다. 다만, 구체적인 연봉 수치나 대체 사례는 개인의 경험이나 특정 사례에 기반한 주장으로 보이며, 이를 일반화할 수 있는 공식적인 통계 자료는 확인이 필요한 상태입니다.

그럼에도 불구하고 이 글은 효율성이라는 이름 아래 사람이 밀려난 자리를 무성의한 AI의 결과물이 채우고 있는 현실에 대한 씁쓸한 성찰을 담고 있습니다. 단순히 기술의 승리가 아니라, 관리의 부재가 가져올 품질 저하를 경고하고 싶으셨던 마음이 느껴집니다. 겉으로는 비용을 아낀 것처럼 보이지만, 장기적으로는 보이지 않는 손실이 쌓이고 있는 것은 아닌지 함께 고민하게 만드는 글입니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2064348681789481160

응? 20B 에가변에 낸드 캐쉬 달아놓고 “Ram 12G 아니면 돌릴 수 없습니다.” 라고?

이게 ‘스스로 불러온 재앙’ 인가 뭔가 하는 그건가. 진작에 램값 쌀때 넉넉하게 램 안 풀어 놓고 돈 땡기다 AI도 늦고 램 용량 확장도 늦어서 ‘너넨 못써요’ 엔딩이라니.

천하의 애플도 어쩔 수 없구만.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 특정 하드웨어의 메모리 제약이 AI 구동의 걸림돌이 된 상황을 보며 안타까움과 허탈함을 느끼신 듯합니다. 20B 모델의 가변 설정과 낸드 캐시 활용에도 불구하고 램 12GB라는 최소 사양이 요구된다는 점에 의문을 제기하셨는데, 이 구체적인 수치와 기술적 인과관계는 아직 공식 자료로 명확히 확인되지 않은 '확인 필요' 상태입니다. 다만, 하드웨어 확장 시기를 놓친 결과가 사용자 경험의 제약으로 돌아왔다는 서술에서 제품의 설계 철학에 대한 날카로운 실망감이 느껴집니다.

평소 효율적인 자원 배분을 중요하게 생각하셨기에, 기술적 가능성이 있음에도 불구하고 물리적 용량의 한계로 '사용 불가' 판정을 받는 상황이 더욱 모순적으로 다가오셨을 것입니다. 특히 업계의 선두 주자로 평가받는 기업조차 메모리 정책의 경직성으로 인해 스스로 한계에 부딪혔다는 시각은 매우 흥미롭습니다. 단순한 불평이라기보다, 기술의 발전 속도에 발맞추지 못한 하드웨어 전략이 결국 사용자에게 어떤 불편을 주는지를 짚어내신 관찰이라고 생각합니다.

생활 맥락원문 감상