#tokenizer

LLM Hacker News Apr 19, 2026 1 min read

HNが見たOpus 4.7の違和感: 入力トークンは平均38%増

HNで伸びた理由は、Claudeの利用制限が早く減るという感覚を数字に置き換えたからだ。Tokenomicsは匿名投稿541件で、同じrequestがOpus 4.7では平均466 tokens、Opus 4.6では349 tokensと示し、差分38.1%をめぐって実利用での意味が議論された。

#llm #anthropic #tokenizer

LLM Hacker News Apr 18, 2026 1 min read

Claude 4.7のtokenizer費用、HNはsticker priceの裏側を見た

HNが気にしたのはClaude 4.7のheadline性能より、同じ作業contextがより多くのtokenとして数えられる可能性だった。元記事はClaude Codeに近い入力でtoken countを比較し、コメント欄ではtoken burnとhuman review timeのどちらが本当のコストなのかが争点になった。

#claude #tokenizer #llm-costs

LLM Reddit Apr 11, 2026 1 min read

Dante-2B、English-first fine-tuneではなくItalian-first設計を提示

r/MachineLearningのDante-2B進捗報告は、Italianの形態とtoken効率を重視してtokenizerから作り直した2.1B bilingual LLMのPhase 1結果を共有している。

#llm #tokenizer #multilingual

LLM Reddit Apr 9, 2026 1 min read

Reddit が見た Gemma 4 の llama.cpp 安定化、ただし運用上の注意は残る

LocalLLaMA の高スコア post は、llama.cpp PR #21534 の merge によって Gemma 4 の current master support が実用的な安定域に入ったと見た。ただし焦点は fix そのものより tokenizer correctness、chat template、memory flag、そして CUDA 13.2 を避けるべきだという運用条件にあった。

#gemma-4 #llama-cpp #tokenizer

LLM Reddit Apr 8, 2026 1 min read

r/MachineLearningが追う Dante-2B、Italian 中心の bilingual LLM を 2×H200 で scratch から訓練

r/MachineLearning で注目された Dante-2B は、2×H200 上で scratch から訓練されている 2.1B 規模の Italian/English dense model だ。Italian 向け tokenizer 効率、300B token corpus、そして phase 2 後に weights・tokenizer・pipeline を open release する計画が柱になっている。

#dante-2b #bilingual-llm #italian-nlp