精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
k

① 在 K-means 算法中 K 是事先給定的,這個 K 值的選定是非常難以估計的。很多時候,事先并不知道給定的數據集應該分成多少個類別才最合適。這也是 K-means 算法的一個不足。有的算法是通過類的自動合并和分裂,得到較為合理的類型數目 K,例如 ISODATA 算法。關于 K-means 算法中聚類數目K 值的確定在文獻中,是根據方差分析理論,應用混合 F統計量來確定最佳分類數,并應用了模糊劃分熵來驗證最佳分類數的正確性。在文獻中,使用了一種結合全協方差矩陣的 RPCL 算法,并逐步刪除那些只包含少量訓練數據的類。而文獻中使用的是一種稱為次勝者受罰的 競爭學習規則,來自動決定類的適當數目。它的思想是:對每個輸入而言,不僅競爭獲勝單元的權值被修正以適應輸入值,而且對次勝單元采用懲罰的方法使之遠離輸入值。

② 在 K-means 算法中,首先需要根據初始聚類中心來確定一個初始劃分,然后對初始劃分進行優化。這個初始聚類中心的選擇對聚類結果有較大的影響,一旦初始值選擇的不好,可能無法得到有效的聚類結果,這也成為K-means算法的一個主要問題。對于該問題的解決,許多算法采用遺傳算法(GA),例如文獻 中采用遺傳算法(GA)進行初始化,以內部聚類準則作為評價指標。

③ 從 K-means 算法框架可以看出,該算法需要不斷地進行樣本分類調整,不斷地計算調整后的新的聚類中心,因此當數據量非常大時,算法的時間開銷是非常大的。所以需要對算法的時間復雜度進行分析、改進,提高算法應用范圍。在文獻中從該算法的時間復雜度進行分析考慮,通過一定的相似性準則來去掉聚類中心的侯選集。而在文獻中,使用的 K-means 算法是對樣本數據進行聚類,無論是初始點的選擇還是一次迭代完成時對數據的調整,都是建立在隨機選取的樣本數據的基礎之上,這樣可以提高算法的收斂速度。

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
R語言K-Means(K均值聚類)和層次聚類算法對微博用戶特征數據研究
機器學習經典算法詳解及Python實現
K-means 聚類算法的三種改進
K-Means算法
K-mediods聚類算法K_means的改進
你需要掌握選擇最佳聚類數目的這10個技巧!
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 衡南县| 大英县| 炉霍县| 通州市| 贺兰县| 陵水| 延寿县| 天全县| 临夏县| 朝阳区| 阳原县| 京山县| 五华县| 西林县| 溆浦县| 邛崃市| 长葛市| 顺昌县| 铁力市| 秦皇岛市| 方山县| 大宁县| 东丽区| 澎湖县| 涟源市| 上杭县| 库车县| 湘潭县| 额尔古纳市| 金秀| 富源县| 宜兴市| 河东区| 浏阳市| 济源市| 浑源县| 濮阳县| 府谷县| 辽中县| 钟祥市| 大港区|