Claude is unreliable. I’ll do it myself. For training, I split all texts into sentences using Chinese punctuation, cleaned non-Chinese/English characters, then used scikit-learn’s TF-IDF → LinearSVC. After cleaning up some noise, sentence-level classification still hit 85% accuracy!
В Финляндии предупредили об опасном шаге ЕС против России09:28,详情可参考PDF资料
為何美國以色列此刻出手?伊朗進入「生存模式」,結局仍充滿變數,详情可参考爱思助手
В МОК высказались об отстранении израильских и американских спортсменов20:59,这一点在体育直播中也有详细论述
Иран установил личности виновных в ударе по школе для девочек в Минабе14:56