部落格

關於技術與開發的思考、教學和見解。

找到 1 篇文章

LLM 原理:從數學直覺到 Python 實作:拆解大型語言模型如何「產生答案」
生成式人工智慧

LLM 原理:從數學直覺到 Python 實作:拆解大型語言模型如何「產生答案」

這篇文章希望帶你跳脫「AI 是黑盒子」的抽象感,改用可驗證、可動手做的方式,逐步拆解 LLM(大型語言模型)在推理時的核心齒輪:Tokenizer → 模型輸出 Logits → Softmax 機率 → Sampling 取樣策略 → 多輪對話的上下文拼接 → Pipeline 封裝。 我們會把「矩陣運算」與「機率分佈」這些看似抽象的概念,落到 Hugging Face Transformers 的實際 API 上,讓你親手看到「看起來像智慧」的效果是怎麼被算出來的。

閱讀更多