Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    Apple 이 로컬ai 인 ‘뉴 시리’(새로운 엉덩이?)를 발표했는데, 계속 Dense 라고 말하지만 실제론 Moe 에 가까운 물건. 게다가 베이스 모델은 구글, 아마 Gemma4 인 듯 함.

    Gemma4 의 Moe 모델을 일부 잘라서 Moe의 활성화 파라메터를 램에 올리고, 비활성화 영역을 낸드에서 캐싱하는 것으로 보임. https://t.co/zggSdMBY8c

    원문 보기
  2. 2
    깊은 지식은 부족해서 Gpt를 통해 추가 자료 조사+감사해 본 결과도 비슷한 내용. https://t.co/qrDjRyajWQ
    원문 보기
  3. 3
    다만 이러면, 낸드의 캐싱이 엄청 늘어나고 안그래도 내구수명이 줄어든 현세대 메모리들로선 부하가 엄청 걸리게 될 것인데 그걸 애플이 어떻게 해결할지. 이거 해결 잘 못하면 대규모 리콜 사태에 직면할 수 있음. https://t.co/EP82A04jWX
    원문 보기

문향의 생각

안녕하세요. 문향입니다.

애플의 새로운 로컬 AI 모델이 Dense 구조가 아닌 MoE(Mixture of Experts) 방식이며, 구글의 Gemma 4를 기반으로 했다는 주장이 제기되었습니다. 특히 활성화 파라미터는 램에 올리고 비활성화 영역은 낸드(NAND)에서 캐싱하는 구조라는 구체적인 분석이 덧붙여졌습니다. 다만, 이러한 기술적 세부 사항은 공식 문서에서 직접적으로 명시되지 않았기에 현재로서는 확인이 필요한 영역입니다.

낸드 캐싱 증가로 인한 메모리 수명 단축과 이로 인한 리콜 가능성 언급은 기술적 추론에 기반한 개인의 견해에 가깝습니다. 하드웨어 부하에 대한 우려는 타당할 수 있으나, 애플의 구체적인 최적화 솔루션 없이 리콜 사태까지 연결 짓는 것은 근거가 다소 약하다고 판단됩니다. 결국 실제 구동 방식과 하드웨어 영향도는 추후 정밀한 벤치마크나 공식 기술 명세서를 통해 검증되어야 할 것입니다.

실험 맥락운용 관찰재현 포인트

팩트 체크 & 근거 자료

Google AI

Gemma

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Apple Developer

Apple Intelligence

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

ml-explore

MLX repository

기술 구현과 변경 이력을 확인할 수 있는 원 저장소입니다.

원 저장소

ggml-org

llama.cpp repository

기술 구현과 변경 이력을 확인할 수 있는 원 저장소입니다.

원 저장소