AI Reddit 5h ago 1 min read
r/LocalLLaMAの新しいスレッドでは、大きなチャットボットではなく、YOLO、LightGBM、Parakeet、OCRなど日々使う小さなAIが話題になった。コストと信頼性では専用モデルが強い場面が多い。
r/LocalLLaMAの新しいスレッドでは、大きなチャットボットではなく、YOLO、LightGBM、Parakeet、OCRなど日々使う小さなAIが話題になった。コストと信頼性では専用モデルが強い場面が多い。
Googleの新しいspeech modelは、きれいに読むだけでなく、声の出し方をテキストで細かく動かす方向へ踏み込んだ。Gemini 3.1 Flash TTSはaudio tags、70+ languages、Artificial Analysisの1,211 Elo、SynthID watermarkingを掲げ、Gemini API、Google AI Studio、Vertex AI、Google Vidsに入る。