Discussion
Loading...

Post

Log in
  • Sign up
  • About
  • Code of conduct
  • Privacy
  • Users
  • Instances
  • About Bonfire
Informa Pirata
Informa Pirata
@informapirata@poliverso.org  ·  activity timestamp 5 days ago

Come Pensa la Macchina: un LLM smontato pezzo per pezzo. Tokenizzazione, embeddings, attention, hallucinations. Ollama in locale, zero fuffa

Smonto la macchina pezzo per pezzo. Ho  #Ollama sul Mac con una decina di modelli. Scelgo il più piccolo: llama3.1:8b, 8 miliardi di parametri, 4.9 gigabyte su disco. Il più facile da maneggiare senza sbatti, e tanto l'architettura è identica per tutti: che siano 8 miliardi o 405 miliardi, il meccanismo è lo stesso. Cambiano le dimensioni delle matrici, non come funziona la macchina. Lo apro dal terminale, guardo i byte, e seguo il percorso completo: dal testo che entra al testo che esce. Ogni passaggio, ogni formula, ogni decisione matematica. Niente metafore del cervello. Niente fuffa. Se vuoi capire come funziona una cosa, la smonti. Non leggi chi ne scrive.

pinperepette.github.io/signal.…

Per conoscere altre notizie sulla #IntelligenzaArtificiale, segui il gruppo @aitech

Come Pensa la Macchina | Signal Pirate

Smontare un LLM pezzo per pezzo. Tokenizzazione, embeddings, attention, transformer e hallucinations. Ollama in locale, math pesante, zero fuffa.
  • Copy link
  • Flag this post
  • Block

Bonfire social

This is a bonfire demo instance for testing purposes

Bonfire social: About · Code of conduct · Privacy · Users · Instances
Bonfire social · 1.0.1 no JS en
Automatic federation enabled
Log in Create account
  • Explore
  • About
  • Members
  • Code of Conduct