單個題模型解題風格對比
1、選擇題測試選擇題第8題:
2、填空題測試填空題第11題:
總 結
總的來說,Kimi的思路探索、解題步驟,尤其是對圖片的識別表現非常出色,136分的表現令人驚喜。
豆包和文心一言:豆包相對來說表現比較穩定,給出的推導步驟相對來說比較簡潔,正確率還是有一定的保證。同時,對于有些問題的求解條理非常清晰,過程步驟比較明顯,很多時候還給出了知識點提示。相對來說,文心一言可能側重點不同,對于一些非常常規的問題能夠給出簡要解答過程和正確結果,但是對于一些簡單問題也不能完成基本的計算,另外不同的一點是,不像Kimi和DeepSeek,在做不出來的時候,它們會進行各種嘗試,可以說會窮舉很多與問題相關的方法,盡一切可能來探索問題的求解思路,而文心一言則僅僅給出文字思路提示,告訴我們它做不下去了!