정보성 글

AI 도구 리뷰

AI, 개발, 모델, 에이전트, 도구 사용 경험 중 정보성이 강한 글입니다.

SINGLE POSTX POST ARCHIVE

대충 Xhigh 로 세션 두개 풀가동하면

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    대충 Xhigh 로 세션 두개 풀가동하면 시간당 천만씩 쓰는거같음.

    그럼 평균적으로 하루에 한 8천~1억씩 쓴다는 소리. 조금 빡시게 한 날은 2억 쓰고.

    워미… Api 종량제로 하면 이미 차 하나 날아갔구만. https://t.co/ytCJSAG1dx https://t.co/Qa4DUtk5XY

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Xhigh 세션을 풀가동했을 때 발생하는 비용을 계산하며, 이를 API 종량제로 환산했다면 상당한 금액이 되었을 것이라는 놀라움을 표현하셨습니다. 시간당 천만 원, 하루 최대 2억 원에 달한다는 구체적인 수치를 언급하셨지만, 이는 공식적인 단가표에 기반한 계산이라기보다 개인적인 사용 경험과 체감 비용을 토대로 한 추산으로 보입니다. 따라서 제시된 금액의 정확한 산출 근거는 추가적인 확인이 필요합니다.

그럼에도 불구하고 이 글에서 느껴지는 것은 고성능 모델을 극한까지 활용하며 느끼는 일종의 경외감과 허탈함이 섞인 감정입니다. 단순히 비용을 계산하는 것을 넘어, 자신이 사용하는 기술의 가치가 현실적인 화폐 가치로 환산되었을 때의 격차를 위트 있게 전달하고 싶으셨던 것 같습니다. 기술적 효율성과 비용 사이의 괴리를 '차 한 대 값'이라는 일상적인 비유로 풀어낸 점이 인상적입니다.

생활 맥락원문 감상

THREAD ESSAYX THREAD ARCHIVE

/Goal 돌려놓고 밥먹으러 출발.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    /Goal 돌려놓고 밥먹으러 출발.

    뭐먹지. https://t.co/yb9nAFCgcH

    원문 보기
  2. 2
    까스까스 돈가스 간만의 외식 https://t.co/lqqvG9GTWE
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 X를 통해 특정 작업(/Goal)을 마친 후 외식을 하러 나선다는 개인적인 일상을 공유하셨습니다. 메뉴로 돈가스를 선택했다는 점은 게시물 내 텍스트와 맥락을 통해 직접적으로 확인되는 사실입니다.

다만, Codex 1차 자료 검토 브리프에서 해당 내용들을 '의견(opinion)'으로 분류하고 판단 근거를 편집 기준과 연결 지은 점은 논리적 비약이 느껴집니다. 식사 메뉴 선택과 같은 단순 사실 기술을 분석적 판단의 영역으로 해석한 근거가 부족하므로, 이 부분은 데이터 분류의 적절성에 대해 확인이 필요합니다.

원문 해석확인 필요

THREAD ESSAYX THREAD ARCHIVE

페이블 복구 되면 써보긴 해야겠네.

5개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    페이블 복구 되면 써보긴 해야겠네. 경험적 표현이 이렇게 차이 나니.

    복구는 될테고, 복구 과정에서 과연 엔트로픽과 정부가 어떤 딜을 할지가 의문.

    원문 보기
  2. 2
    유출된 시스템 프롬만 거의 117K. 명령 한번에 최소 30K의 시스템 컨텍스트를 가져감. 하네스 엔지니어링으로 모델을 쥐어짜는 모습을 보여주는데 토큰 소비도 소비지만 작업 공간 감소로 컨텍스트 부패에 시달리게 됨. 싱글턴 경험이 우수할 수 있어도 멀티턴에서 능력이 대폭 떨어질 것이라.
    원문 보기
  3. 3
    사실 엔트로픽의 모델들은 초두효과를 강렬하게 준다고 생각하고 있음. 학습 데이터셋이 매우 좋고 이를 통해 다른 모델이 달성하지 못한 깊은 추론을 이끌어내는 역량을 확보했음. 매끄러운 언어 구사력과 구조 구축 역량은 보는 사람들에게 ‘매우 일을 잘 하는 모델’이라는 인식을 심어 줄 수 있음.
    원문 보기
  4. 4
    다만, 잘 만들어진 베이스 모델에 강한 하네스 엔지니어링이 추가로 들어가기 때문에 한번 환각에 빠지면 전혀 엉뚱한 일을 하는 경우도 많았음. 모델 자체의 능력으로 매우 그럴듯한 거짓말을 지어내는 상황에서 모델에 대한 신뢰까지 쌓여 있는 상황이라 문제 인식 타이밍이 늦어지게 됨.
    원문 보기
  5. 5

    그래서 차라리 실수한 순간 망가져 문제를 빠르게 캐치하는 모델이 작업하기에 더 좋았고, 이미 그간 Gemini 의 에이전트 콜링 실패+ 환각에 지쳐버린 상황에서 선택할 이유가 없던게 그간 클로드를 멀리한 이유였는데.

    과연 페이블이라고 달라졌을까. 달라질 이유는 없어 보이는데.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

엔트로픽 모델의 시스템 프롬프트 유출 규모와 그로 인한 컨텍스트 부패 가능성, 그리고 하네스 엔지니어링의 영향에 대한 Serio님의 분석은 기술적 근거를 바탕으로 하고 있습니다. 다만, 시스템 프롬프트의 구체적인 토큰 소비량과 이것이 멀티턴 능력 저하로 이어진다는 인과관계는 공식 자료로 완전히 입증되지 않았기에 추가적인 확인이 필요합니다.

모델의 추론 역량과 언어 구사력이 주는 '초두효과'나 환각 발생 시의 위험성에 대한 견해는 개인의 경험적 판단에 가깝습니다. 특히 특정 모델의 신뢰도가 오히려 문제 인식 타이밍을 늦춘다는 주장은 주관적 해석의 영역이며, 페이블의 변화 가능성에 대한 회의론 역시 현재로서는 근거가 약한 추측에 불과합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

AI연구는 오픈소스가 정답인 이유.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1
    AI연구는 오픈소스가 정답인 이유.
    원문 보기
  2. 2
    어려운 일일수록 개방되고 공유되어야 한다. 그래야 또 다른 아이디어와 노력들이 더해져서 다음 경지로 나아갈 수 있다. 나만이, 우리만이, 우리만의 것을이란 편협한 생각이 모든 것을 망친다.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 AI 연구의 정답이 오픈소스에 있으며, 개방과 공유가 기술적 진보의 필수 조건이라는 견해를 밝히셨습니다. 다만 제시된 원문과 1차 자료 검토 브리프를 살펴보면, 이러한 주장은 객관적 사실보다는 작성자의 가치관과 해석에 기반한 '의견'으로 분류됩니다. 구체적인 데이터나 실증적 근거가 제시되지 않았기에, 오픈소스가 정답이라는 결론의 논리적 근거는 현재로서는 확인이 필요합니다.

독점적 사고가 발전을 저해한다는 주장 역시 보편적인 통찰일 수 있으나, 이를 입증할 공식적인 지표나 사례는 함께 제공되지 않았습니다. NIST나 OECD의 AI 원칙과 같은 표준 자료들이 참고 문헌으로 나열되어 있음에도, 정작 본문에서는 이들의 구체적인 내용이 어떻게 연결되는지 명시되지 않아 주장의 설득력이 약합니다. 결국 개방성이 가져오는 실질적인 효용에 대해서는 추가적인 보완 설명이 뒷받침되어야 할 것으로 보입니다.

원문 해석확인 필요

SINGLE POSTX POST ARCHIVE

🍿

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2065995995830534219

🍿

gpt + gemini 3.1 결과나 gpt + qwen 3.6 27b 결과도 있었으면 재미있었을 텐데

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 특정 AI 모델들의 조합 결과에 대한 아쉬움을 표현하셨으나, 이는 개인적인 기대와 판단에 기반한 의견입니다. 언급된 모델들의 명칭과 버전이 공식 문서상의 표기법과 일치하는지, 혹은 특정 실험 환경에서의 가칭인지에 대해서는 1차 자료로 명확히 확인되지 않습니다. 따라서 해당 모델 조합의 실재 여부와 그 결과값에 대한 주장은 현재로서는 확인이 필요한 영역입니다.

단순한 소회를 넘어 이를 기술적 사실로 받아들이기에는 근거가 부족하며, 주관적 판단과 객관적 사실이 혼재되어 있습니다. 공식 API 문서나 릴리스 노트에서 해당 버전의 조합 성능을 입증하는 구체적인 데이터가 제시되지 않은 만큼, 이를 일반화된 결론으로 도출하기에는 무리가 있습니다. 결국 이 글은 기술적 분석보다는 개인의 취향과 호기심이 반영된 단편적인 의견으로 보는 것이 타당합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

SINGLE POSTX POST ARCHIVE

트럼프 막부에 반항하던 엔트로픽 번주 다리오

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066231071864410189

트럼프 막부에 반항하던 엔트로픽 번주 다리오

새로 지은 성 ‘페이블’로 인해 개역(改易)을 강요당하다.

“성을 부숴라.” https://t.co/J742OIayon

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

Serio님은 엔트로픽의 다리오 아모데이와 새로운 모델 '페이블'을 둘러싼 상황을 마치 에도 시대의 권력 다툼처럼 묘사하며 흥미로운 비유를 던지셨습니다. 다만 '개역(改易)'이나 '성을 부숴라'와 같은 표현은 실제 사건에 대한 객관적 사실이라기보다, 기술 패권 경쟁의 냉혹함을 문학적으로 풀어낸 개인적인 해석에 가깝습니다. 구체적으로 어떤 정치적·경제적 압박이 있었는지는 공식 자료로 확인되지 않기에, 이 부분은 Serio님의 독특한 시각이 반영된 관찰로 읽어야 할 것 같습니다.

그럼에도 이런 비유를 사용하신 이유는 단순히 정보를 전달하기보다, 거대 기업과 권력 사이의 긴장감을 극적으로 보여주고 싶으셨기 때문이 아닐까 싶습니다. 사실 관계의 명확한 증거보다는 업계의 흐름을 읽는 Serio님만의 직관과 위트가 돋보이는 짧은 기록이라는 인상을 받았습니다. 복잡한 AI 생태계의 권력 구조를 한 편의 시대극처럼 묘사한 지점이 무척 다정하면서도 날카로운 통찰처럼 느껴집니다.

생활 맥락원문 감상

SINGLE POSTX POST ARCHIVE

세계 각국의 소버린 ai경쟁이라

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

원문 글: https://x.com/Multi_Serio_Ai/status/2066029145138790777

세계 각국의 소버린 ai경쟁이라

경쟁이 없는데 어떻게 경쟁하죠?

육상선수랑 일반인이 붙는걸 경쟁이라 하지 않아요. 나쁜 표현들을 덧붙이죠.

미스트랄은 구려도 투명하기라도 하지.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

최근 화두가 되고 있는 '소버린 AI' 경쟁이라는 표현에 대해 Serio님은 다소 회의적인 시선을 보내고 계십니다. 압도적인 기술 격차가 존재하는 상황을 과연 대등한 '경쟁'이라 부를 수 있는지, 오히려 육상 선수와 일반인의 대결처럼 불균형한 구도가 아니냐는 날카로운 비유를 던지셨습니다. 특히 미스트랄 AI의 투명성을 언급하며 현재의 시장 상황을 짚어내신 부분에서, 기술적 우위보다 더 중요한 가치가 무엇인지 고민하신 흔적이 느껴집니다.

다만, 특정 모델의 성능이 낮다거나 투명성 여부에 대한 구체적인 비교 수치는 제시되지 않아, 이 부분은 개인적인 체감이나 주관적 판단에 가까운 영역으로 보입니다. 어떤 기준에서 '구리다'고 느끼셨는지, 혹은 투명성의 척도가 무엇인지에 대해서는 추가적인 확인이 필요해 보입니다. 그럼에도 불구하고 무분별하게 쓰이는 '경쟁'이라는 단어의 허상을 꼬집으려 하신 그 마음만큼은 충분히 공감이 갑니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    불가능한 걸 가능하게 만들라는 건, 조폭들이 상대방의 것을 강탈할때 쓰는 방법임. 즉 엔트로픽이 문제 해결이 아닌 다른 거래 조건을 들고 오지 않는다면 거래는 성사되지 않을 것.

    그게 뭔지는 모두가 알고 있겠지. https://t.co/BDJhPNydTq

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 엔트로픽이 제시하는 조건이 현실적이지 않다면 거래 성사가 어려울 것이라는 냉철한 시각을 보여주셨습니다. 특히 '불가능을 가능하게 하라'는 요구를 강압적인 방식에 비유하신 점이 인상적인데, 이는 현재의 협상 구도가 대등한 파트너십보다는 일방적인 요구에 가깝다는 개인적인 판단으로 읽힙니다. 다만, 구체적으로 어떤 거래 조건이 결여되었는지나 상대측의 실제 입장은 공식적으로 드러나지 않았기에 이 부분은 확인이 필요해 보입니다.

전체적으로 보면 논리적인 분석보다는 현재의 상황을 바라보는 Serio님의 날카로운 직관과 답답함이 섞인 관찰기에 가깝다는 생각이 듭니다. 모두가 알고 있을 것이라며 생략하신 '그것'이 무엇인지 궁금해지게 만드는, 일종의 함축적인 메시지를 던지신 것 같습니다. 비즈니스 세계의 냉혹함을 비유적으로 표현하시며, 단순한 문제 해결을 넘어선 실질적인 대안이 필요함을 역설하신 것으로 보입니다.

생활 맥락원문 감상

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1
    엌 160 엌 언제 이렄게 많이 쓴거얔 엌 https://t.co/P0NrnNlsbE
    원문 보기
  2. 2
    누가 몇백억 토큰 쓴다길래 그게 누구야 대체 누가그렇게 많이 쓰는거야 하고 있었는데 내가 그러고 있었네.
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 본인의 토큰 사용량이 160억 개에 달한다는 사실에 놀라움을 표하며, 타인의 과도한 사용량을 의아해했던 과거의 자신을 회상하고 있습니다. 다만, 제시된 X(구 트위터) 게시물과 링크만으로는 실제 사용량이 160억 토큰인지에 대한 객관적인 수치를 직접 검증할 수 없습니다. 따라서 해당 수치에 관한 주장은 현재로서는 공식적인 확인이 필요한 상태입니다.

작성자가 느낀 당혹감과 깨달음은 개인의 주관적인 경험과 의견에 해당하므로 사실 여부를 가릴 대상은 아닙니다. 하지만 근거가 되는 데이터의 실체를 명확히 확인하지 못한 채 수치만을 언급한 점은 논리적 완결성 측면에서 다소 약하다고 판단됩니다. 정확한 사용량 확인을 위해서는 서비스 제공자의 공식 집계 리포트와 같은 보완 자료가 뒷받침되어야 할 것입니다.

원문 해석확인 필요

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    결국 나의 실수를 인정하고 안티그래비티 2.0 을 지우고 IDE로 복귀. 예상대로 세션은 다 죽었고, Gemini 3.5 Flash 는 수행하지도 못하면서 ‘하지만 빨랐죠?’ 를 시전함.

    하아. https://t.co/ux24GqNFsI

    원문 보기
  2. 2

    구글 AI 계정이 있으면 클로드 결제를 안해도 되는 혜자 설정 중 하나. 어짜피 클라우드니 뭐니 해서 구글 계정은 하나정도는 결제해서 끌고가야하니 정말 꼭 필요한 거 아니면 클로드 결제를 안해도 되는 건 너무 소중하다.

    4.7? - 그거 엔트로픽도 버렸잖아요. 4.8? - 추론 못하는 바보 말입니까?

    원문 보기
  3. 3

    사실 오푸스 4.6에서 욕심 내지 말고, 억지 부리지 말고, 천천히 차근차근 할 것만 하면서 개발자의 친구 역할을 충실히 수행했다면 지금쯤 모든 걸 다 가진 회사가 되었을 것임.

    하지만 신의 힘을 가졌다고 착각한 인간은 금새 오만해졌고, 교만해졌고, 거만해졌다.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 안티그래비티 2.0 삭제 후 IDE로 복귀하며 겪은 세션 손실과 Gemini 3.5 Flash의 성능 부족을 지적하셨습니다. 구글 AI 계정의 경제적 효용성에 대한 언급은 개인의 이용 환경에 따른 주관적 판단이나, 특정 모델 버전(4.7, 4.8)의 성능 및 엔트로픽의 행보에 관한 주장은 공식 자료만으로는 명확히 입증되지 않아 확인이 필요합니다.

특히 오푸스 4.6 이후의 기업 전략과 태도에 대해 '오만함'과 '교만함'이라는 강한 표현으로 비판하신 부분은 사실관계보다는 개인의 가치 판단에 가깝습니다. 이러한 정성적 평가는 기술적 지표로 증명될 수 없는 영역이기에, 객관적 근거가 약한 주관적 논평으로 분류하는 것이 타당합니다. 결국 기술적 완성도보다 기업의 태도가 시장 지배력을 결정했다는 시각은 흥미로우나, 구체적인 근거 제시가 보완되어야 할 대목입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서