基于完整似然最短信息长度准则的高斯混合模型聚类

来源：爱问旅游网

Ｊｏｕｒｎａｌ　ｏｆ　Ｓｏｕｔｈｅａｓｔ　Ｕｎｉｖｅｒｓｉｔｙ（Ｅｎｇｌｉｓｈ　Ｅｄｉｔｉｏｎ）Ｖｏ１．２９，Ｎｏ．１，ＰＰ．４３—４７　Ｍａｒ．２０１３　ＩＳＳＮ　１００３—７９８５　Ｇａｕｓｓｉａｎ　ｍｉｘｔ　ａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏ　ｅｌｍｏｄｅｌ　ｃｌｕｓｔｅｒｉｎｇｎｇ　ｗｉｔｈ　ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉｔｅｒｉｏｎ　Ｚｅｎｇ　Ｈｏｎｇ　Ｌｕ　Ｗｅｉ　Ｓｏｎｇ　Ａｉｇｕｏ　（　Ｓｃｈｏｏｌ　ｏｆ　Ｉｎｓｔｒｕｍｅｎｔ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｅｎｇｉｎｅｅｒｉｎｇ，Ｓｏｕｔｈｅａｓｔ　Ｕｎｉｖｅｒｓｉｔｙ，Ｎａｎｊｉｎｇ　２１００９６，Ｃｈｉｎａ）　（　Ｃｏｌｌｅｇｅ　ｏｆ　Ｅｎｇｉｎｅｅｒｉｎｇ，Ｎａｎｊｉｎｇ　Ａｇｒｉｃｕｌｔｕｒａｌ　Ｕｎｉｖｅｒｓｉｔｙ，Ｎａｎｊｉｎｇ　２１００３１，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ａｎ　ｉｍｐｒｏｖｅｄ　Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ（ＧＭＭ）一　ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ｍｅｔｈｏｄ　ｉｓ　ｐｒｏｐｏｓｅｄ　ｆｏｒ　ｔｈｅ　ｄｉｆｆｉｃｕｌｔ　ｃａｓｅ　ｔｉｏｎ　ｃｒｉｔｅｒｉｏｎ（ＡＩＣ），ｔｈｅ　ｉｎｔｅｇｒａｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｃｒｉｔｅｒｉｏｎ　（ＩＬＣ），ｅｔｃ．　ｗｈｅｒｅ　ｔｈｅ　ｔｒｕｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｏｆ　ｄａｔａ　ｉｓ　ａｇａｉｎｓｔ　ｔｈｅ　ａｓｓｕｍｅｄ　ＧＭＭ．Ｆｉｒｓｔ，ａｎ　ｉｍｐｒｏｖｅｄ　ｍｏｄｅｌ　ｓｅｌｅｃｔｉｏｎ　ｃｒｉｔｅｒｉｏｎ，ｔｈｅ　ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉｔｅｒｉｏｎ，ｉｓ　ｄｅｒｉｖｅｄ．Ｉｔ　ｃａｎ　ｍｅａｓｕｒｅ　ｂｏｔｈ　ｔｈｅ　ｇｏｏｄｎｅｓｓ．Ｏｆ－ｆｉｔ　ｏｆ　ｔｈｅ　ｃａｎｄｉｄａｔｅ　Ｇ　ｔｏ　ｔｈｅ　ｄａｔａ　ａｎｄ　ｔｈｅ　ｇｏｏｄｎｅｓｓ—ｏｆ－ｐａｒｔｉｔｉｏｎ　ｏｆ　ｈｔｅ　ｄａｔａ．Ｓｅｃｏｎｄｌｙ，ｂｙ　ｕｔｉｌｉｚｉｎｇ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｃｒｉｔｅｒｉｏｎ　ａｓ　ｔｈｅ　ｃｌｕｓｔｅｒｉｎｇ　ｏｂｊｅｃｔｉｖｅ　ｆｕｎｃｔｉｏｎ，　ａｎ　ｉｍｐｒｏｖｅｄ　ｅｘｐｅｃｔａｔｉｏｎ—　ｍａｘｉｉｍｚａｔｉｏｎ（ＥＭ）ａｌｇｏｒｉｔｈｍ　ｉｓ　ｄｅｖｅｌｏｐｅｄ，ｗｈｉｃｈ　ｃａｉ１　ａｖｏｉｄ　ｐｏｏｒ　ｌｏｃａｌ　ｏｐｔｉｍａｌ　ｓｏｌｕｔｉｏｎｓ　ｃｏｍｐａｒｅｄ　ｔｏ　ｔｈｅ　ｓｔａｎｄａｒｄ　ＥＭ　ｌａｇｏｒｉｔｈｍ　ｆｏｒ　ｅｓｔｉｍａｔｉｎｇ　ｔｈｅ　ｍｏｄｅｌ　ｐａｒａｍｅｔｅｒｓ．　ｅ　ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｄｅｍｏｎｓｔｒａｔｅ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｍｅｔｈｏｄ　ｃａｎ　ｒｅｃｔｉｆｙ　ｔｈｅ　ｏｖｅｒ－ｆｉｔｔｉｎｇ　ｔｅｎｄｅｎｃｙ　ｏｆ　ｒｅｐｒｅｓｅｎｔａｔｉｖｅ　Ｇ删一ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ａｐｐｒｏａｃｈｅｓ　ａｎｄ　ｃａｎ　ｒｏｂｕｓｔｌｙ　ｐｒｏｖｉｄｅ　ｍｏｒｅ　ａｃｃｕｒａｔｅ　ｃｌｕｓｔｅｒｉｎｇ　ｒｅｓｕｌｔｓ．　Ｋｅｙ　ｗｏｒｄｓ：　Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ；　ｎｏｎ—Ｇａｕｓｓｉａｎ　ｉｄｓｔｒｉｂｕｔｉｏｎ；　ｍｏｄｅｌ　ｓｅｌｅｃｔｉｏｎ；　ｅｘｐｅｃｔａｔｉｏｎ－ｍａｘｉｉｍｚａｔｉｏｎ　ｌａｇｏｒｉｔｈｍ；ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉ—　ｔｅｒｉｏｎ　ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００３—７９８５．２０１３．Ｏ１．００９　Ｔ　ｈｕｅｓ　ｅｄＧ　ａｕｓ　ｓｓａｉ　ａｂｎａ　ｓｍｉｓ　ｉｘｆｏｔｕｒｒ　ｅｃ　ｌｕｍｓｏｔｅｄｒｅ　ｌ（ｎａａＧｌｙＭＭ）ｉｓｉｓ　．Ｉｓ　ｎｃｏ　ｇｍｍｅｎｅｏｒｎ１ａｌｙ．　　ｈｔｅ　ＧＭＭ—ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ｉｎｖｏｌｖｅｓ　ｔｗｏ　ｐｒｏｂｌｅｍｓ．Ｏｎｅ　ｉｓ　ｈｔｅ　ｅｓｔｉｍａｔｉｏｎ　ｏｆ　ｐａｒａｍｅｔｅｒｓ　ｆｏｒ　ｔｈｅ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌｓ．Ｔｈｅ　ｏｔｈｅｒ　ｉｓ　ｔｈｅ　ｍｏｄｅｌ　ｏｒｄｅｒ　ｓｅｌｅｃｔｉｏｎ　ｆｏｒ　ｄｅｔｅｒｍｉｎｉｎｇ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｃｏｍｐｏｎｅｎｔｓ．Ｔｈｅ　ｅｘｐｅｃｔａｔｉｏｎ—ｍａｘｉｍｉｚａｔｉｏｎ　（ＥＭ１　ａｌｇｏｒｉｔｈｍ　ｉｓ　ｏｆｔｅｎ　ｕｓｅｄ　ｔｏ　ｅｓｔｉｍａｔｅ　ｔｈｅ　ｐａｒａｍｅｔｅｒｓ　ｏｆ　ｔｈｅ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｗｈｉｃｈ　ｆｉｔｓ　ｔｈｅ　ｏｂｓｅｒｖｅｄ　ｄａｔａ．Ｐｏｐｕ．　１ａｒ　ｍｏｄｅｌ　ｓｅｌｅｃｔｉｏｎ　ｃｒｉｔｅｒｉａ　ｉｎ　ｔｈｅ　ｌｉｔｅｒａｔｕｒｅ　ｉｎｃｌｕｄｅ　ｔｈｅ　Ｂａｙｅｓｉａｎ　ｉｎｆｏｒｍａｔｉｏｎ　ｃｒｉｔｅｒｉｏｎ　ｒ　ＢＩＣ１。Ａｋａｉｋｅ’ｓ　ｉｎｆｏｒｍａ－　Ｒｅｅｅｉｖｅｄ　２０１２－０７－２０．　Ｂｉｏｇｒａｐｈｙ：Ｚｅｎｇ　Ｈｏｎｇ（１９８１——），ｍａｌｅ，ｄｏｃｔｏｒ，ｌｅｃｍｍｒ，ｈｚｅｎｇ＠ｓｅｕ．　ｅｄｕ．ｃａ．　Ｆｏｕｎｄａｆｉｏｎ　ｉｔｅｍｓ：Ｔｈｅ　Ｎａｔｉｏｎａｌ　Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ　Ｆｏｕｎｄａｆｉｏｎ　ｏｆ　Ｃｈｉｎａ　（Ｎｏ．６１　１Ｏ５ｏ４８，６０９７２１６５）。ｔｈｅ　Ｄｏｃｔｏｒａｌ　Ｆｕｎｄ　ｏｆ　Ｍｉｎｉｓｔｒｙ　ｏｆ　Ｅｄｕｃａ—　ｔｉｏｎ　ｏｆ　Ｃｈｉｎａ（Ｎｏ．２０１　１０ｏ９２１２０ｏ３４），ｔｈｅ　Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ　Ｆｏｕｎｄａｔｉｏｎ　ｏｆ　Ｊｉａｎｇｓｕ　Ｐｒｏｖｉｎｃｅ（Ｎｏ．ＢＫ２０１０２４０），ｔｈｅ　Ｔｅｃｈｎｏｌｏｇｙ　Ｆｏｕｎｄａｔｉｏｎ　ｆｏｒ　Ｓｅｌｅｃｔｅｄ　Ｏｖｅｒｓｅａｓ　Ｃｈｉｎｅｓｅ　Ｓｃｈｏｌａｒ，Ｍｉｎｉｓｔｒｙ　ｏｆ　Ｈｕｍａｎ　Ｒｅｓｏｕｒｃｅｓ　ａｎｄ　Ｓｏｃｉｌａ　Ｓｅｃｕｒｉｔｙ　ｏｆＣｈｉｎａ（Ｎｏ．６７２２ｏｃｌｏ０ｏ８），ａｎｄｔｈｅＯｐｅｎＦｕｎｄ　ｏｆ　Ｊｉｎａ—　ｇｓｕ　Ｐｒｏｖｉｎｃｅ　Ｋｅｙ　Ｌａｂｏｒａｔｏｒｙ　ｆｏｒ　Ｒｅｍｏｔｅ　Ｍｅａｓｕｒｉｎｇ　ａｎｄ　Ｃｏｎｔｒｏｌ（Ｎｏ．　ＹＣＣＫ２Ｏｌ０ｏ５１．　Ｃｉｔａｔｉｏｎ：Ｚｅｎｇ　Ｈｏｎｇ，Ｌｕ　Ｗｅｉ，Ｓｏｎｇ　Ａｉｇｕｏ．Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｃｌｕｓｔｅｒｉｎｇ　ｗｉｔｈ　ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉｔｅｒｉｏｎ　［Ｊ］．Ｊｏｕｍａｌ　ｏｆ　Ｓｏｕｔｈｅａｓｔ　Ｕｎｉｖｅｒｓｉｔｙ（Ｅｎｇｌｉｓｈ　Ｅｄｉｔｉｏｎ），２０１３，２９（１）：　４３—４７．【ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１ｏ０３—７９８５．２０１３．０１．ｏｏ９】　Ｈｏｗｅｖｅｒ，ｍｏｓｔ　ｐｒｅｖｉｏｕｓ　ｓｔｕｄｉｅｓ　ｇｅｎｅｒａｌｌｙ　ａｓｓｕｍｅ　ｔｈｅ　Ｇａｕｓｓｉａｎ　ｃｏｍｐｏｎｅｎｔｓ　ｆｏｒ　ｔｈｅ　ｏｂｓｅｒｖｅｄ　ｄａｔａ　ｉｎ　ｔｈｅ　ｍｉｘｔｕｒｅ　ｍｏｄｅ１．Ｉｆ　ｔｈｅ　ｔｒｕｅ　ｍｏｄｅｌ　ｉｓ　ｎｏｔ　ｉｎ　ｔｈｅ　ｆａｍｉｌｙ　ｏｆ　ｔｈｅ　ａｓ—　ｓｕｍｅｄ　ｏｎｅｓ，ｔｈｅ　ＢＩＣ　ｃｒｉｔｅｒｉｏｎ　ｔｅｎｄｓ　ｔｏ　ｏｖｅｒｅｓｔｉｍａｔｅ　ｔｈｅ　ｃｏｒｒｅｃｔ　ｍｏｄｅｌ　ｓｉｚｅ　ｒｅｇａｒｄｌｅｓｓ　ｏｆ　ｈｔｅ　ｓｅｐａｒａｔｉｏｎ　ｏｆ　ｔｈｅ　ｃｏｍ—　ｐｏｎｅｎｔｓ．Ｉｎ　ｔｈｅ　ｍｅａｎｔｉｍｅ，ｂｅｃａｕｓｅ　ｔｈｅ　ＥＭ　ａｌｇｏｒｉｔｈｍ　ｉｓ　ａ　ｌｏｃａｌ　ｍｅｔｈｏｄ，ｉｔ　ｉｓ　ｐｒｏｎｅ　ｔｏ　ｆａｌｌｉｎｇ　ｉｎｔｏ　ｐｏｏｒ　ｌｏｃａｌ　ｏｐｔｉｍａ　ｉｎ　ｓｕｃｈ　ａ　ｃａｓｅ，ｌｅａｄｉｎｇ　ｔｏ　ｍｅａｎｉｎｇｌｅｓｓ　ｅｓｔｉｍａｔｉｏｎ．Ｉｎ　ｏｒ－　ｄｅｒ　ｔｏ　ａｐｐｒｏｘｉｍａｔｅ　ｓｕｃｈ　ａ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｍｏｒｅ　ａｃｃｕｒａｔｅｌｙ，　ｈｔｅ　ｆｅａｔｕｒｅ　ｗｅｉｇｈｔｅｄ　ＧＭＭ，ｗｈｉｃｈ　ｅｘｐｌｉｃｉｔｌｙ　ｔａｋｅｓ　ｔｈｅ　ｎｏｎ－Ｇａｕｓｓｉａｎ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｉｎｔｏ　ａｃｃｏｕｎｔ，ｉｓ　ａｄｏｐｔｅｄ　ｉｎ　Ｒｅｆｓ．［３—８】．Ｎｅｖｅｒｔｈｅｌｅｓｓ，ｔｈｅ　ａｐｐｒｏａｃｈｅｓ　ｉｎ　Ｒｅｆｓ．［３—　８】ａｓｓｕｍｅ　ｈｔａｔ　ｔｈｅ　ｄａｔａ　ｆｅａｔｕｒｅｓ　ｒａｅ　ｉｎｄｅｐｅｎｄｅｎｔ，ｗｈｉｃｈ　ｉｓ　ｏｆｔｅｎ　ｎｏｔ　ｔｈｅ　ｃａｓｅ　ｆｏｒ　ｒｅａｌ　ａｐｐｌｉｃａｔｉｏｎｓ．Ｂａｓｅｄ　ｏｎ　ｔｈｅ　ｍｉｎ—　ｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ（ＭＭＬ）ｃｒｉｔｅｒｉｏｎ，Ｒｅｆ．［９】ｐｒｏ—　ｐｏｓｅｄ　ａｎ　ｉｍｐｒｏｖｅｄ　ＥＭ　ａｌｇｏｒｉｔｈｍ　ｔｈａｔ　ｃａｎ　ｅｆｆｅｃｔｉｖｅｌｙ　ａｖｏｉｄ　ｐｏｏｒ　ｌｏｃａｌ　ｏｐｔｉｍａ．Ｂｕｔ　ｗｅ　ｆｉｎｄ　ｔｈａｔ　ｉｔ　ｓｔｉｌｌ　ｔｅｎｄｓ　ｔｏ　ｓｅｌｅｃｔ　ｍｕｃｈ　ｍｏｒｅ　Ｇａｕｓｓｉａｎ　ｃｏｍｐｏｎｅｎｔｓ　ｔｈａｎ　ｎｅｃｅｓｓａｒｙ　ｆｏｒ　ｉｆｔｔｉｎｇ　ｔｈｅ　ｄａｔａ　ｗｉｔｈ　ｕｎｉｆｏｒｍ　ｄｉｓｔｒｉｂｕｔｉｏｎ，ｇｉｖｉｎｇ　ｏｂｓｃｕｒｅ　ｅｖｉｄｅｎｃｅ　ｆｏｒ　ｔｈｅ　ｃｌｕｓｔｅｒｉｎｇ　ｓｔｒｕｃｔｕｒｅ　ｏｆ　ｄａｔａ．　Ｗｅ　ｐｒｏｐｏｓｅ　ａ　ｎｏｖｅｌ　ｍｅｔｈｏｄ　ｔｏ　ａｄｄｒｅｓｓ　ｔｈｅ　ｍｏｄｅｌ　ｓｅｌｅｃ—　ｔｉｏｎ　ａｎｄ　ｐａｒａｍｅｔｅｒ　ｅｓｔｉｍａｔｉｏｎ　ｐｒｏｂｌｅｍｓ　ｉｎ　ｔｈｅ　ＧＭＭ－　ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ｍｅｔｈｏｄ　ｗｈｅｎ　ｔｈｅ　ｔｒｕｅ　ｄａｔａ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｉｓ　ａｇａｉｎｓｔ　ｔｈｅ　ａｓｓｕｍｅｄ　ｏｎｅ．Ｉｎ　ｐａｒｔｉｃｕｌａｒ，ｗｅ　ｄｅｒｉｖｅ　ａｎ　ｉｍ－　ｐｒｏｖｅｄ　ｍｏｄｅｌ　ｓｅｌｅｃｔｉｏｎ　ｃｒｉｔｅｒｉｏｎ　ｆｏｒ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌｓ　ｗｉｔｈ　ａｎ　ｅｘｐｌｉｃｉｔ　ｏｂｊｅｃｔｉｖｅ　ｏｆ　ｃｌｕｓｔｅｒｉｎｇ．Ｆｕｒｔｈｅｒｍｏｒｅ，ｗｉｈｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｃｒｉｔｅｒｉｏｎ　ａｓ　ｔｈｅ　ｃｏｓｔ　ｆｕｎｃｔｉｏｎ，ａｎ　ｉｍｐｒｏｖｅｄ　ＥＭ　ａｌｇｏｒｉｔｈｍ　ｉｓ　ｄｅｖｅｌｏｐｅｄ　ｆｏｒ　ｅｓｔｉｍａｔｉｎｇ　ｐａｒａｍｅｔｅｒｓ．Ｕｌｔｉ－　ｍａｔｅｌｙ，ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｍｅｔｈｏｄ　ｉｓ　ｎｏｔ　ｏｎｌｙ　ａｂｌｅ　ｔｏ　ｒｅｃｔｉｆｙ　ｈｔｅ　ｏｖｅｒ－－ｆｉｔｔｉｎｇ　ｔｅｎｄｅｎｃｙ　ｏｆ　ｓｏｍｅ　ｒｅｐｒｅｓｅｎｔａｔｉｖｅ　ｍｏｄｅｌ　ｓｅ・－　ｌｅｃｔｉｏｎ　ｃｒｉｔｅｒｉａ，ｂｕｔ　ａｌｓｏ　ａｂｌｅ　ｔｏ　ａｖｏｉｄ　ｐｏｏｒ　ｌｏｃａｌ　ｏｐｔｉｍａ　ｏｆ　ｔｈｅ　ＥＭ　ａｌｇｏｒｉｈｔｍ．　１　Ｃｏｍｐｌｅｔｅｄ　Ｌｉｋｅｌｉｈｏｏｄ　ｏｆ　ｔｈｅ　Ｇａｕｓｓｉａｎ　Ｍｉｘｔｕｒｅ　Ｍｏｄｅｌ　Ｓｕｐｐｏｓｅ　ｔｈａｔ　ａ　Ｄ・－ｄｉｍｅｎｓｉｏｎａｌ　ｓａｍｐｌｅ　ｆｏｌｌｏｗｓ　ａ　Ｋ－ｃｏｍ－・　ｐｏｎｅｎｔ　ｍｉｘｔｕｒｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ，ｔｈｅｎ　ｔｈｅ　ｐｒｏｂａｂｉｌｉｔｙ　ｄｅｎｓｉｔｙ　ｆｕｎｃｔｉｏｎ　ｏｆＹ　ｃａｎ　ｂｅ　ｗｒｉｔｔｅｎ　ａｓ　Ｐ（Ｙ　ｌ　＝∑ｗｋ＝】　ｐ（Ｙ　ｌ　Ｏｋ）　（１）　ｗｈｅｒｅ　ｗ　ｉｓ　ｔｈｅ　ｍｉｘｉｎｇ　ｐｒｏｂａｂｉｌｉｔｙ　ｆｏｒ　ｔｈｅ　ｋ－ｔｈ　ｍｉｘｔｕｒｅ　Ｚｅｎｇ　Ｈｏｎｇ，Ｌｕ　Ｗｅｉ，ａｎｄ　Ｓｏｎｇ　Ａｉｇｕｏ　ｃｏｍｐｏｎｅｎｔ　ｗｉｔｈ　０≤ｗ　≤１　ａｎｄ∑ｗ　：ｌ；ｏ　ｉｓ　ｔｈｅ　ｉｎｔｅｒ—　ｎａｌ　ｐａｒａｍｅｔｅｒｓ　ｄｅｓｃｒｉｂｉｎｇ　ｔｈｅ　ｋ－ｔｈ　ｍｉｘｔｕｒｅ　ｃｏｍｐｏｎｅｎｔ．Ｏ　ＧＭＭ　ｏｆ　ｔｈｅ　ｃｏｍｐｌｅｔｅ　ｄａｔａ　Ｙ　ｃａｎ　ｂｅ　ｗｒｉｔｔｅｎ　ａｓ　ｆｏｌｌｏｗｓ：　ＭＭＬ（　）＝一ｌｏｇｐ（　）一ｌｏｇ（＿ｙ　ｌ　）＋　＝｛０ｌ…．，０　；ｗｌ，…，ｗ　）ｄｅｎｏｔｅｓ　ｔｈｅ　Ｄ　ｄｉｍｅｎｓｉｏｎａｌ　ｖｅｃｔｏｒ　ｄｅｓｃｒｉｂｉｎｇ　ｔｈｅ　ｃｏｍｐｌｅｔｅ　ｓｅｔ　ｏｆ　ｐａｒａｍｅｔｅｒｓ　ｆｏｒ　ｔｈｅ　丢－。ｇ　ｆ，ｃ（　）ｌ＋譬（ｔ＋１。ｇ　）　（７）　一ｍｉｘｔｕｒｅ　ｍｏｄｅ１．Ｐ（・１　０　）ｄｅｆｉｎｅｓ　ｔｈｅ　ｋ－ｔｈ　Ｇａｕｓｓｉａｎ　ｄｅｎ—　ｗｈｅｒｅ　ｌｏｇｐ（Ｙ　ｌ　）ｉｓ　ｇｉｖｅｎ　ｉｎ　Ｅｑ．（５）；Ｉ　（　）＝　ｓｉｔｙ．Ｔｈｅ　ＧＭＭ　ｉｓ　ｔｙｐｉｃａｌｌｙ　ａｎ　ｉｎｃｏｍｐｌｅｔｅ　ｄａｔａ　ｓｔｒｕｃｔｕｒｅ　ｍｏｄｅ１．Ｎ　ｉｎｄｅｐｅｎｄｅｎｔ　ａｎｄ　ｉｄｅｎｔｉｃａｌｌｙ　ｄｉｓｔｒｉｂｕｔｅｄ　ｓａｍｐｌｅｓ　Ｅ［０２ｌｏｇｐ（　ｌ　０）／ｏ０ｏ０　］ｉｓ　ｈｔｅ　ｅｘｐｅｃｔｅｄ　Ｆｉｓｈｅｒ　ｉｎ　ｆｏｒｍａｔｉｏｎ　ｍａｔｉｒｘ　ａｓｓｏｃｉａｔｅｄ　ｗｉｔｈ　ｔｈｅ　ｃｏｍｐｌｅｔｅ　ｄａｔａ＿ｙ，ａｎｄ　ｏｆ　ｈｅ　ｉｔｎｃｏｍｐｌｅｔｅ　ｄａｔａ　Ｙ　ｒｅ　ｄｅｎｏｔａｅｄ　ａｓ　Ｙ＝｛Ｙ１，…ＹⅣ｝，　ｆ　Ｉ　（Ｏ）ｌ　ｄｅｎｏｔｅｓ　ｉｔｓ　ｄｅｔｅｒｍｉｎａｎｔ．　Ｂｙ　ｄｉｆｆｅｒｅｎｔｉａｔｉｎｇ　ｎｄ　ｔａｈｅ　ｃｏｍｐｌｅｔｅ　ｄａｔａ　ｒａｅ　Ｙ＝｛Ｙ，Ｚ｝：｛（Ｙｌ，ｚ１），…（ＹⅣ，　ｌｏｇｐ（Ｙ　ｌ　）ｉｎ　Ｅｑ．（５），Ｉ。（Ｄ）ｈａｓ　ａ　ｂｌｏｃｋ—ｄｉａｇｏｎａｌ　ｚⅣ）｝，ｗｈｅｒｅ　ｈｅ　ｍｉｔｓｓｉｎｇ　ｄａｔａ　ａｒｅ　Ｚ＝｛ｚ１，…，ｚⅣ｝，ｗｉｔｈ　ｓｔｒｕｃｔｕｒｅ　Ｊ　（　）＝Ｎ　ｂｌｏｃｋ—ｄｉａｇ｛　ＩＩ”　（　１），…，　ｚ　＝｛ｚ　ｌ，…，ｚ　｝ｂｅｉｎｇ　ｔｈｅ　ｂｉｎａｒｙ　ｌａｂｅｌ　ｖｅｃｔｏｒ　ｓｕｃｈ　ｔｈａｔ　（　），Ａ｝ｗｈｅｒｅ　（　）ｉｓ　ｔｈｅ　Ｆｉｓｈｅｒ　ｍａｔｒｉｘ　ｆｏｒ　ａ　ｚ　＝１　ｉｆ　ａｎｄ　ｏｎｌｙ　ｉｆＹ　ｂｅｌｏｎｇｓ　ｔｏ　ｔｈｅ　ｋ－ｔｈ　ｍｉｘｔｕｒｅ　ｃｏｍ—　ｐｏｎｅｎｔ　ａｎｄ　ｚ　：０　ｏｔｈｅｒｗｉｓｅ．Ｚ　ｉｓ　ｎｏｒｍａｌｌｙ　ｕｎｋｎｏｗｎ，　ｎａｄ　ｉｔ　ｍｕｓｔ　ｂｅ　ｉｎｆｅｒｒｅｄ　ｆｒｏｍ　ｙ．Ｔｈｅ　ｏｂｓｅｒｖｅｄ　ｌｏｇ—ｌｉｋｅｌｉ—　ｈｏｏｄ　ｏｆ　ｆｏｒ　ｔｈｅ　ｉｎｃｏｍｐｌｅｔｅ　ｄａｔａ　Ｙ　ｉｓ　Ⅳ　ｌｏｇｐ（Ｙ　　ｌ）＝∑ｌｎ＝１　ｏｇ∑ｗ　ｋ＝１　Ｐ（Ｙ　）　（２）　Ｔｈｅ　ｃｏｍｐｌｅｔｅｄ　ｌｏｇ—ｌｉｋｅｌｉｈｏｏｄ　ｏｆ　Ｙ　ｉｓ　ｌｏｇｐ（ｔ＂Ｉ　）＝∑∑ｚ．ｋｌｏｇ（ｗ　Ｐ（Ｙ　ｌ　Ｏｋ））：　Ｈ＝ｌ　ｋ＝ｌ　１ｏｇｐ（Ｙ　ｌ　）＋ｌｏｇｐ（Ｚ　ｌ　ｙ，０）＝　Ｎ　Ｋ　Ｎ　Ｘ　∑ｌｏｇ∑ｗｋｐ（ｙ　ｌ　）＋∑∑Ｚｎｋ１ｏｇｐ　ｎ　１　＝１　ｎ＝１　＝１　（３）　ｗｈｅｒｅ　Ｐ　ｉｓ　ｔｈｅ　ｃｏｎｄｉｔｉｏｎａｌ　ｐｒｏｂａｂｉｌｉｔｙ　ｏｆ　Ｙ　ｂｅｌｏｎｇｉｎｇ　ｔｏ　ｔｈｅ　一ｔｈ　ｃｏｍｐｏｎｅｎｔ　ａｎｄ　ｃａｎ　ｂｅ　ｃｏｍｐｕｔｅｄ　ａｓ　ｗ　Ｐ（Ｙ　ｌ　）　Ｐ　—　——————一　（４）　∑ｗｊＪ；１　ｐ（ｙ　ｌ　）　Ｉｎ　ｐｒａｃｔｉｃｅ，ｔｈｅ　ｔｒｕｅ　ｐａｒａｍｅｔｅｒ　Ｏ　ｉｎ　Ｅｑｓ．（２）ａｎｄ（３）　ｉｓ　ｒｅｐｌａｃｅｄ　ｕｓｉｎｇ　ｔｈｅ　ｍａｘｉｍｕｍ　ｌｉｋｅｌｉｈｏｏｄ（ＭＬ）ｅｓｔｉｍａｔｅ　．ｎａｄ　ｔｈｅｎ　ｔｈｅ　ｃｏｍｐｌｅｔｅｄ　ｌｏｇ—ｌｉｋｅｌｉｈｏｏｄ　ｉｓ　ｒｅｗｒｉｔｔｅｎ　ａｓ　Ｎ　Ｋ　ｌｏｇｐ（Ｙ　Ｉ　）＝∑ｌ＝ｌ　ｏｇ∑ｗｋｋ＝１　ｐ（Ｙ　＋∑∑　ｌｎ＝ｌ　ｋ＝１　ｏｇｐ　（５）　ｗｈｅｒｅ　ｉｆａｒｇ　ｍ＝　ｘａｊ　ｐｗ一　（６）　ｏｔｈｅｒｗｉｓｅ　２　Ｃｌｕｓｔｅｒｉｎｇ　ｗｉｔｈ　Ｃｏｍｐｌｅｔｅｄ　Ｌｉｋｅｌｉｈｏｏｄ　Ｍｉｎｉｍｕｍ　Ｍｅｓｓａｇｅ　Ｌｅｎｇｔｈ（ＣＬ－ＭＭＬ）Ｃｒｉｔｅｒｉｏｎ　２．１　Ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉ－　ｔｅｒｉｏｎ　Ｔｈｅ　ＭＭＬ　ｃｒｉｔｅｒｉｏｎ　ｄｅｆｉｎｅｓ　ａ　ｇｏｏｄｎｅｓｓ　ｍｅａｓｕｒｅ　ｆｏｒ　ａ　ｍｏｄｅｌ　ｗｉｔｈ　ａｎ　ｉｎｈｅｒｅｎｔ　ｂｉａｓ　ｔｏｗａｒｄｓ　ｓｉｍｐｌｅ　ｍｏｄｅｌｓ…．　Ｂａｓｅｄ　ｏｎ　ｔｈｅ　ｆｏｒｍｕｌａｔｉｏｎ　ｏｆ　ｔｈｅ　ＭＭＬ　ｃｒｉｔｅｒｉｏｎ　ｆｏｒ　ａ　ｇｅｎ—　ｅｒａｌ　ｄｅｎｓｉｔｙ　ｍｏｄｅｌ　ｉｎ　Ｒｅｆ．［９］，ｔｈｅ　ＭＭＬ　ｃｒｉｔｅｒｉｏｎ　ｏｆｒ　ｈｔｅ　ｓｉｎｇｌｅ　ｏｂｓｅｒｖａｔｉｏｎ　ｐｒｏｄｕｃｅｄ　ｂｙ　ｔｈｅ　ｋ－ｔｈ　ｃｏｍｐｏｎｅｎｔ，ａｎｄ　Ａ　ｉｓ　ｔｈｅ　Ｆｉｓｈｅｒ　ｍａｔｒｉｘ　ｏｆ　ａ　ｍｕｌｔｉｎｏｍｉａｌ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｗｉｔｈ　ｌＡ　Ｉ＝（谛ｌ　２…　）＿。．Ｓｉｎｃｅ　ｗｅ　ｈａｖｅ　ｎｏ　ｋｎｏｗｌｅｄｇｅ　ａｂｏｕｔ　ｔｈｅ　ｐａｒａｍｅｔｅｒｓ，ｗｅ　ａｄｏｐｔ　ｔｈｅ　ｎｏｎ—ｉｎｆｏｒｍａｔｉｖｅ　Ｊｅｆｆｒｅｙ’ｓ　ｐｒｉｏｒｓ　ａｓ　ｉｎ　Ｒｅｆ．［９］，ｉ．ｅ．，　ｐ（　）＝ｐ（　一，ＷＫ）兀ｐ（１　ｂ　）　（８）　＝ｗｈｅｒｅ　Ｐ（　）。ｃ　１　研，ｐ（　，…，　）ｐｃ　Ｔ　Ａｆｔｅｒ　ｓｕｂｓｔｉｔｕｔｉｎｇ　Ｐ（　）ａｎｄ　ｌ　ｊ　（　）ｌ　ｉｎｔｏ　Ｅｑ．（７）ａｎｄ　ｄｒｏｐｐｉｎｇ　ｔｈｅ　ｃｏｎｓｔａｎｔ　ｉｔｅｍｓ，ｗｅ　ｏｂｔａｉｎ　ｔｈｅ　ｅｘｐｌｉｃｉｔ　ｆｏｒｍ　ｏｆ　ＣＬ—ＭＭＬ　ｆｏｒ　ｔｈｅ　ＧＭＭ　ｏｆ　ｔｈｅ　ｃｏｍｐｌｅｔｅ　ｄａｔａ　ａｓ　ｆｏｌｌｏｗｓ：　ＣＬ—ＭＭＬ（Ｋ）：一ｌｏｇ（￣ｚ　ｌ　）＋（一∑∑￣．ｋｌｏｇｐ　）＋　Ｍ∑了Ｋ　１。ｇ　＋了Ｄｋ（１＋ｌｏｇＮ）　（９）　ｗｈｅｒｅ　Ｍ　ｉｓ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｐａｒａｍｅｔｅｒｓ　ｉｎ　ｅａｃｈ　ｃｏｍｐｏｎｅｎｔ．　Ｔｈｅ　ｆｉｒｓｔ　ｉｔｅｍ　ｏｎ　ｔｈｅ　ｒｉｇｈｔ　ｈａｎｄ　ｓｉｄｅ　ｏｆ　Ｅｑ．（９）ｅｍｐｈａｓｉ—　ｚｅｓ　ｔｈｅ　ｇｏｏｄｎｅｓｓ．ｏｆ－ｆｉｔ　ｏｆ　ｔｈｅ　ｃａｎｄｉｄａｔｅ　ＧＭＭ．Ｔｈｅ　ｔｈｉｒｄ　ａｎｄ　ｔｈｅ　ｆｏｕｒｔｈ　ｉｔｅｍｓ　ｃｏｎｔｒｏｌ　ｔｈｅ　ｃｏｍｐｌｅｘｉｔｙ　ｏｆ　ｔｈｅ　ＧＭＭ．　Ｃｏｍｐａｒｅｄ　ｔｏ　ｔｈｅ　ｓｔａｎｄａｒｄ　ＭＭＬ　ｆｏｒ　ｔｈｅ　ＧＭＭ　ｏｆ　ｉｎｃｏｍ—　ｐｌｅｔｅ　ｄａｔａ　ｉｎ　Ｒｅｆ．１　９｝，ＣＬ—ＭＭＬ　ｈａｓ　ａｎ　ｅｘｔｒａ　ｎｏｎ—ｎｅｇａ—　ｔｉｖｅ　ｐｅｎａｌｔｙ　ｉｔｅｍ．ｉ．ｅ．．ｔｈｅ　ｓｅｃｏｎｄ　ｉｔｅｍ　ｏｎ　ｔｈｅ　ｆｉｇｈｔ　ｓｉｄｅ　ｏｆ　Ｅｑ．（９、．Ｔｈｉｓ　ｉｔｅｍ　ｉｓ　ｅｓｓｅｎｔｉａｌｌｙ　ａ　ｍｅａｓｕｒｅ　ｏｆ　ｔｈｅ　Ｋ－　ｃｏｍｐｏｎｅｎｔ　ＧＭＭ　ｔｏ　ｐｒｏｖｉｄｅ　ａ　ｒｅｌｅｖａｎｔ　ｐａｒｔｉｔｉｏｎ　ｏｆ　ｔｈｅ　ｄａ．　ｔａ　ｙ．Ｉｆ　ｔｈｅ　ｍｉｘｔｕｒｅ　ｃｏｍｐｏｎｅｎｔｓ　ａｒｅ　ｗｅｌｌ　ｓｅｐａｒａｔｅｄ（ｉ．ｅ．．　Ｐ　．ｉｓ　ｃｌｏｓｅ　ｔｏ　ｌ　ｗｉｈｔ　ｚ　．＝１），ｓｕｃｈ　ａｎ　ｉｔｅｍ　ｗｉｌｌ　ｂｅ　ｃｌｏｓｅ　ｔｏ　０．Ｂｕｔ　ｉｆ　ｔｈｅ　ｍｉｘｔｕｒｅ　ｃｏｍｐｏｎｅｎｔｓ　ａｒｅ　ｐｏｏｒｌｙ　ｓｅｐａｒａｔｅｄ．　ｓｕｃｈ　ａｎ　ｉｔｅｍ　ｗｉｌｌ　ｈａｖｅ　ａ　ｌａｒｇｅ　ｖａｌｕｅ，ｉｍｐｌｙｉｎｇ　ｔｈａｔ　ｓｕｃｈ　ａｎ　ｕｎｒｅａｓｏｎａｂｌｅ　ｐａｒｔｉｔｉｏｎ　ｃａｎｎｏｔ　ｄｉｓｃｏｖｅｒ　ｔｈｅ　ｃｌｕｓｔｅｒｉｎｇ　ｓｔｒｕｃｔｕｒｅ　ｏｆ　ｄａｔａ．Ｂｙ　ｍｉｎｉｍｉｚｉｎｇ　ｔｈｉｓ　ｉｔｅｍ．ＣＬ—ＭＭＬ　ｐｒｅｆｅｒｓ　ｓｍａｌｌｅｒ　Ｋ　ｃｏｍｐａｒｅｄ　ｔｏ　ｔｈｅ　ＭＭＬ　ｏｎ　ｔｈｅ　ｓａｍｅ　ｄａｔａ　ｓｅｔ．Ｉｎ　ｏｔｈｅｒ　ｗｏｒｄｓ．ＣＬ一＾　＾　Ｉ　ｉｓ　ｅｘｐｅｃｔｅｄ　ｔｏ　ｂｅ　ａｂｌｅ　ｔｏ　ｒｅｃｔｉｆｙ　ｔｈｅ　ｏｖｅｒ—ｆｉｔｔｉｎｇ　ｔｅｎｄｅｎｃｙ　ｏｆ　ｔｈｅ　ＭＭＬ，ｆａｖｏｒｉｎｇ　ｍｉｘｔｕｒｅｓ　ｗｈｉｃｈ　ｌｅａｄ　ｔｏ　ａ　ｃｌｕｓｔｅｒｉｎｇ　ｒｅｓｕｌｔ　ｏｆ　ｔｈｅ　ｄａｔａ　ｗｉｍ　ｔｈｅ　ｇｒｅａｔｅｓｔ　ｅｖｉｄｅｎｃｅ．　２．２　Ｅｓｔｉｍａｔｉｏｎ　ｏｆ　ＧＭＭ　ｐａｒａｍｅｔｅｒｓ　Ｆｏｒ　ｔｈｅ　ＧＭＭ，ｅａｃｈ　ｃｏｍｐｏｎｅｎｔ　ｆｏｌｌｏｗｓ　ｔｈｅ　Ｇａｕｓｓｉａｎ　Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｃｌｕｓｔｅｒｉｎｇ　ｗｉｔｈ　ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉｔｅｒｉｏｎ　４５　ｄｉｓｔｒｉｂｕｔｉｏｎ，ｉ．ｅ．，Ｐ（Ｙ　１　０ｔ）＝Ｇ（ｙ　１　，　），ｗｈｅｒｅ　ａｎｄ　ａｒｅ　ｔｈｅ　ｍｅａｎ　ａｎｄ　ｔｈｅ　ｃｏｖａｒｉａｎｃｅ　ｍａｔｒｉｘ　ｏｆ　ｔｈｅ　ｋ－ｔｈ　ｗｈｅｒｅ，＝｛ｒｌ，ｒ２，ｒ３，ｒ４｝ａｒｅ　ｔｈｅ　ｐａｒａｍｅｔｅｒｓ　ｏｆ　ｔｈｅ　ｄｉｓ—　ｔｒｉｂｕｔｉｏｎ．１　０００　ｄａｔａ　ｐｏｉｎｔｓ　ａｒｅ　ｇｅｎｅｒａｔｅｄ　ｕｓｉｎｇ　ａ　５－ｃｏｍ—　ｐｏｎｅｎｔ　ｕｎｉｆｏｒｍ　ｍｉｘｔｕｒｅ　ｍｏｄｅ１．Ｉｔｓ　ｐａｒａｍｅｔｅｒｓ　ａｒｅ　ａｓ　ｆｏｌ—　ｌｏｗｓ：　Ｇａｕｓｓｉａｎ　ｃｏｍｐｏｎｅｎｔｓ．Ｆｏｒ　ａ　ｆｉｘｅｄ　ｍｏｄｅｌ　ｏｒｄｅｒ　Ｋ，ｗｅ　ｅｓ－　ｔｉｍａｔｅ　ｔｈｅ　ＧＭＭ　ｐａｒａｍｅｔｅｒｓ　Ｏ　ｂｙ　ａｎ　ｉｍｐｒｏｖｅｄ　ＥＭ　ａｌｇｏ—　ｒｉｈｍ，ｗｉｔｈ　ＣＬ—ｔＭＭＬ　ｉｎ　Ｅｑ．（９）ａｓ　ｔｈｅ　ｃｏｓｔ　ｆｕｎｃｔｉｏｎ．　Ｔｈｅ　ｐｒｏｐｏｓｅｄ　ＥＭ　ａｌｇｏｒｉｔｈｍ　ａｌｔｅｒｎａｔｉｖｅｌｙ　ａｐｐｌｉｅｓ　ｔｈｅ　ｆｏｌ—　ｌｏｗｉｎｇ　ｔｗｏ　ｓｔｅｐｓ　ｉｎ　ｔｈｅ　ｔ－ｔｈ　ｉｔｅｒａｔｉｏｎ　ｕｎｔｉｌ　ｃｏｎｖｅｒｇｅｎｃｅ：　Ｅ－ｓｔｅｐ：Ｃｏｍｐｕｔｅ　ｔｈｅ　ｃｏｎｄｉｔｉｏｎａｌ　ｅｘｐｅｃｔａｔｉｏｎ：　ｗｌ＝０．１，ｗ２＝ｗ４＝ｗ５＝０．２，ｗ３＝０．３　ｐ：：’：　Ｐ（Ｙ　Ｉ　）　（１Ｏ）　，ｌ＝｛一１．８９，４．０７，４．８９，７．９４｝　，２＝｛１．１１，５．１１，２．４７，３．５３｝　，３＝｛５．１７，６．５３，２．７７，５．７７　ｒ４＝｛４．３１，６．４９，６．２９，６．７１　，５＝｛５．５８，８．４２，－０．７７，２．２３　∑　“Ｐ（Ｙ　１　Ｊ＝１　Ｍ—ｓｔｅｐ：Ｕｐｄａｔｅ　ｔｈｅ　ｐａｒａｍｅｔｅｒｓ　ｏｆ　ｔｈｅ　ＧＭＭ　ｂｙ　Ｎ　…　ｐ：　）一　）　ｒ　１１、＝　Ｋ　ｍａｘ｛。，（　Ｎ　ｐ　）一等）　∑ｐ　Ｙ　一　Ｎ　（１２　１　∑ｐ　∑ｐ　（ｊ，　一　）（ｊ，　一　—．．．！　．　！　．　．　．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．。．．．．．．．．．．．．．．．．．．．．．．．　．．．．．．．．．．．．．．．．．．．．．．．．．．．．一　一　Ｎ　（１３）　∑ｐ　Ｉｎ　Ｅｑ．（１１），∑ｐ　ｃａｎ　ｂｅ　ｖｉｅｗｅｄ　ａｓ　ｔｈｅ　ｅｖｉｄｅｎｃｅ　ｏｆｒ　ｔｈｅ　ｋ－ｔｈ　ｃｏｍｐｏｎｅｎｔ　ｆｒｏｍ　ｔｈｅ　ｄａｔａ　ｐｏｉｎｔｓ．Ｔｈｅｎ　ａｃｃｏｒｄｉｎｇ　ｔｏ　Ｅｑ．（１　１），ｗｈｅｎ　ｏｎｅ　ｏｆ　ｔｈｅ　ｃｏｍｐｏｎｅｎｔｓ　ｂｅｃｏｍｅｓ　ｔｏｏ　ｗｅａｋ，ｎａｍｅｌｙ　ｉｔ　ｉｓ　ｎｏｔ　ｓｕｐｐｏｒｔｅｄ　ｂｙ　ｔｈｅ　ｄａｔａ，ｉｔ　ｗｉｌｌ　ｔｈｅｎ　ｂｅ　ｄｒｉｖｅｎ　ｉｎｔｏ　ｅｘｔｉｎｃｔｉｏｎ．Ｓｕｃｈ　ａ　ｍｏｄｉｆｉｃａｔｉｏｎ　ｔｏ　ｔｈｅ　ｓｔａｎｄａｒｄ　ＥＭ　ｃａｎ　ｂｅ　ｅｘｐｅｃｔｅｄ　ｔｏ　ｓｕｐｐｒｅｓｓ　ｓｐｕｒｉｏｕｓ　ｓｏｌｕ—　ｔｉｏｎｓ　３　Ｅｘｐｅｒｉｍｅｎｔｓ　Ｗｅ　ｐｒｅｓｅｎｔ　ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｔｏ　ｉｌｌｕｓｔｒａｔｅ　ｔｈｅ　ｅｆｆｅｃ．　ｔｉｖｅｎｅｓｓ　ｏｆ　ＣＬ．ＭＭ＿Ｌ　ｆｏｒ　ＧＭＭ．ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ｆ　ｄｅｎｏｔｅｄ　ａｓ　ＧＭＭ＋ＣＬ．ＭＭＬ）。ｃｏｍｐａｒｅｄ　ｔｏ　ｔｈａｔ　ｏｆ　ＢＩＣ（ｄｅｎｏ．　ｔｅｄ　ａｓ　ＧＭＭ＋ＢＩＣ）．Ⅳ　Ｉ　（ｄｅｎｏｔｅｄ　ａｓ　ＧＭＭ＋　ＭＭＬ）．ａｓ　ｗｅｌｌ　ａｓ　ｔｈｅ　ｍｅｔｈｏｄ　ｕｔｉｌｉｚｉｎｇ　ｔｈｅ　ｆｅａｔｕｒｅ．　ｗｅｉｇｈｔｅｄ　ＧＭＭ　ａｎｄ　ｔｈｅ　ｉｎｔｅｇｒａｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｃｒｉｔｅｒｉｏｎ　（ＦＷＧＭＭ＋ＩＬＣ）ｆｏｒ　ｃｌｕｓｔｅｒｉｎｇ　』．　３．１　Ｓｙｎｔｈｅｔｉｃ　ｄａｔａ　Ｗｅ　ｃｏｎｓｉｄｅｒ　ａ　ｓｙｎｔｈｅｔｉｃ　２Ｄ　ｄａｔａ　ｓｅｔ　ｗｈｅｒｅ　ｄａｔａ　ｆｒｏｍ　ｅａｃｈ　ｃｌｕｓｔｅｒ　ｆｏｌｌｏｗ　ｔｈｅ　ｕｎｉｆｏｒｌＴｌ　ｒａｎｄｏｍ　ｄｉｓｔｒｉｂｕｔｉｏｎ：　“　（），　，Ｙ２）＝　（　ｒｏ１ｈｔ≤ｅｙｒｗ１≤ｉｓｅｒ　２；ｒ３≤ｙ２≤ｒ４　Ｔｈｅ　Ｇａｕｓｓｉａｎ　ｃｏｍｐｏｎｅｎｔｓ　ａｒｅ　ａｄｏｐｔｅｄ　ｔｏ　ｆｉｔ　ｓｕｃｈ　ａ　ｕｎｉ．　ｆｏｒｍ　ｍｉｘｔｕｒｅ　ｄａｔａ　ｓｅｔ，ｆｏｒ　ｗｈｉｃｈ　ｔｈｅ　ｔｒｕｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｍｏｄｅｌｓ　ａｒｅ　ｖｅｒｙ　ｄｉｆｆｅｒｅｎｔ　ｆｒｏｍ　ｔｈｅ　ａｓｓｕｍｅｄ　ｏｎｅｓ．Ｔｈｅ　ｍｏｄｅｌｓ　ｗｉｔｈ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｃｏｍｐｏｎｅｎｔｓ　Ｋ　ｖａｒｙｉｎｇ　ｆｒｏｍ　１　ｔｏ　，ａ　ｎｕｍｂｅｒ　ｔｈａｔ　ｉｓ　ｃｏｎｓｉｄｅｒｅｄ　ｔｏ　ｂｅ　ｓａｆｅｌｙ　ｌｒａｇｅｒ　ｈｔａｎ　ｔｈｅ　ｔｒｕｅ　ｎｕｍｂｅｒ（ｉ．ｅ．，５），ａｒｅ　ｅｖａｌｕａｔｅｄ．　ｉｓ　ｓｅｔ　ｔｏ　ｂｅ　３０　ｉｎ　ｍｉｓ　ｃａｓｅ．Ｗｅ　ｅｖａｌｕａｔｅ　ｔｈｅｓｅ　ｍｅｔｈｏｄｓ　ｂｙ　ｔｈｅ　ａｃｃｕｒａｃｙ　ｉｎ　ｅｓｔｉｍａｔｉｎｇ　ｔｈｅ　ｍｏｄｅｌ　ｏｒｄｅｒ　ａｎｄ　ｓｔｒｕｃｔｕｒｅ．　Ｔａｂ．１　ｉｌｌｕｓｔｒａｔｅｓ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｔｉｍｅｓ　ｔｈａｔ　ｅａｃｈ　ｏｒｄｅｒ　ｉｓ　ｓｅｌｅｃｔｅｄ　ｏｖｅｒ　５０　ｔｒｉａｌｓ．Ｆｉｇ．１　ｓｈｏｗｓ　ｔｙｐｉｃａｌ　ｃｌｕｓｔｅｒｉｎｇ　ｒｅ一　ｓｕｌｔｓ　ｂｙ　ｔｈｅｓｅ　ｆｏｕｒ　ｍｅｔｈｏｄｓ．　Ｉｔ　ｃａｎ　ｂｅ　ｏｂｓｅｒｖｅｄ　ｔｈａｔ　ｆｏｒ　ｓｕｃｈ　ａ　ｄａｔａ　ｓｅｔ．ｔｈｅ　ＧＭＭ＋　ＢＩＣ　ａｐｐｒｏａｃｈ　ｎｏｔ　ｏｎｌｙ　ｆａｉｌｓ　ｔｏ　ｙｉｅｌｄ　ａ　ｇｏｏｄ　ｅｓｔｉｍａｔｉｏｎ　ｏｆ　ｍｏｄｅｌ　ｏｒｄｅｒ（ｓｅｅ　Ｔａｂ．１），ｂｕｔ　ａｌｓｏ　ｌｅａｄｓ　ｔｏ　ａ　ｍｅａｎｉｎｇ—　ｌｅｓｓ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｂｙ　ｔｈｅ　ｓｔｎａｄａｒｄ　ＥＭ（ｓｅｅ　Ｆｉｇ．１（ａ））．　ＡＩｔｈｏｕｇｈ　ｔｈｅ　ＭＭＬ　ｃｒｉｔｅｒｉｏｎ　ｇｅｎｅｒａｔｅｓ　ａ　ＧＭＭ　ｗｈｉｃｈ　ｆｉｔｓ　ｔｈｅ　ｄａｔａ　ｗｅｌ１．ｉｔ　ｓｕｆｆｅｒｓ　ｆｒｏｍ　ｓｅｖｅｒｅ　ｏｖｅｒ．ｆｉｔｔｉｎｇ　ａｓ　ｓｈｏｗｎ　ｉｎ　Ｆｉｇ．１（ｂ）ａｎｄ　Ｔａｂ．１．Ｓｉｎｃｅ　ｔｈｅ　ｆｅａｔｕｒｅｓ　ａｒｅ　ａｓｓｕｍｅｄ　ｔ０　ｂｅ　ｉｎｄｅｐｅｎｄｅｎｔ　ｉｎ　ＦＷＧＭＭ．ｉｔ　ａｌｓｏ　ｔｅｎｄｓ　ｔｏ　ｓｅｌｅｃｔ　ｍｏｒｅ　ｃｏｍｐｏｎｅｎｔｓ　ｉｎ　ｏｒｄｅｒ　ｔｏ　ａｐｐｒｏｘｉｍａｔｅ　ｔｈｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｏｆ　ｄａｔａ　ａｃｃｕｒａｔｅｌｙ（ｓｅｅ　Ｆｉｇ．１（ｃ）ａｎｄ　Ｔａｂ．１）．　Ｔａｂ．１　Ｎｕｍｂｅｒ　ｏｆ　ｔｉｍｅｓ　ｆｏｒ　ｓｅｌｅｃｔｅｄ　ｍｏｄｅｌ　ｏｒｄｅｒｓ　ｏｖｅｒ　５０　ｔｒｉａｌｓ　ｏｎ　ｓｙｎｔｈｅｔｉｃ　ｄａｔａ　Ｉｎ　ｃｏｎｔｒａｓｔ．ｄｕｅ　ｔｏ　ｔｈｅ　ｉｎｔｒｏｄｕｃｔｉｏｎ　ｏｆ　ａｎ　ｅｘｔｒａ　ｐｅｎａｌｔｙ　ｔｏ　ｔｈｅ　ＭＭＬ　ｃｒｉｔｅｒｉｏｎ．ｔｈｅ　ｐｒｏｐｏｓｅｄ　ＣＬ．ＭＭＬ　ｃｒｉｔｅｒｉｏｎ．　ｂａｓｅｄ　ＧＭＭ　ｃｌｕｓｔｅｒｉｎｇ　ｆａｖｏｒｓ　ｍｕｃｈ　ｆｅｗｅｒ　ｂｕｔ　ｍｏｒｅ　“ｐｏｗｅｒｆｕｌ”ｃｏｍｐｏｎｅｎｔｓ　ｗｈｉｃｈ　ｓｕｃｃｅｓｓｆｕｌｌｙ　ｄｅｔｅｃｔ　ｔｈｅ　ｃｌｕｓｔｅｒｓ．Ｔｈｅ　ｃｌｕｓｔｅｒｉｎｇ　ｒｅｓｕｌｔ　ｉｎ　ａ　ｔｙｐｉｃａｌ　ｓｕｃｃｅｓｓｆｕｌ　ｔｒｉａ１　ｏｆＣＬ—ＭＭＬ　ｉｓ　ｓｈｏｗｎ　ｉｎ　Ｆｉｇ．１（ｄ）．　Ｚｅｎｇ　Ｈｏｎｇ，Ｌｕ　Ｗｅｉ，ａｎｄ　Ｓｏｎｇ　Ａｉｇｕｏ　ａｒｅ　ｓｕｍｍａｒｉｚｅｄ　ｉｎ　Ｔａｂ．２．Ｆｏｒ　ｅａｃｈ　ｄａｔａ　ｓｅｔ．ｗｅ　ｒａｎｄｏｍ—　ｌｙ　ｓｐｌｉｔ　ｔｈｅ　ｄａｔａ　５０　ｔｉｍｅｓ　ｉｎｔｏ　ｔｒａｉｎｉｎｇ　ａｎｄ　ｔｅｓｔ　ｓｅｔｓ．Ｔｒａｉｎ—　ｉｎｇ　ｓｅｔｓ　ａｒｅ　ｃｒｅａｔｅｄ　ｆｒｏｍ　５０％ｏｆ　ｔｈｅ　ｏｖｅｒａｌｌ　ｄａｔａ　ｐｏｉｎｔｓ．　Ｗｅ　ｄ０　ｎｏｔ　ｕｓｅ　ａｎｙ　ｌａｂｅｌ　ｉｎ　ｔｈｅ　ｔｒａｉｎｉｎｇ　ｓｔａｇｅ．Ｋ　ｉｓ　ｓｔｉｌｌ　ｓｅｔ　ｔｏ　ｂｅ　３０．Ａｆｔｅｒ　ｍｏｄｅｌ　ｌｅａｒｎｉｎｇ．ｗｅ　ｌａｂｅｌ　ｅａｃｈ　ｃｏｍｐｏ—　ｎｅｎｔ　ｂｙ　ｍａｊｏｒｉｔｙ　ｖｏｔｅ　ｕｓｉｎｇ　ｔｈｅ　ｃｌａｓｓ　ｌａｂｅｌｓ　ｐｒｏｖｉｄｅｄ　ｆｏｒ　ｔｈｅ　ｔｅｓｔ　ｄａｔａ，ａｎｄ　ｗｅ　ｍｅａｓｕｒｅ　ｔｈｅ　ｔｅｓｔ　ｓｅｔ　ｃｌａｓｓｉｆｉｃａｔｉｏｎ　ａｃ－　ｃｕｒａｃｙ　ａｓ　ｔｈｅ　ｍａｔｃｈｉｎｇ　ｄｅｇｒｅｅ　ｂｅｔｗｅｅｎ　ｓｕｃｈ　ｏｂｔａｉｎｅｄ　ｌａ－　ｂｅｌｓ　ａｎｄ　ｔｈｅ　ｏｒｉｇｉｎａｌ　ｔｒｕｅ　ｌａｂｅｌｓ．Ｔｈｅ　ｍｅａｎｓ　ａｎｄ　ｔｈｅ　ｓｔａｎｄａｒｄ　ｄｅｖｉａｔｉｏｎｓ　ｏｆ　ｔｈｅ　ｃｌａｓｓｉｆｉｃａｔｉｏｎ　ａｃｃｕｒａｃｙ，ａｓ　ｗｅｌｌ　ａｓ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｃｏｍｐｏｎｅｎｔｓ　ｆｏｒ　ｅａｃｈ　ｄａｔａ　ｓｅｔ．ｏｖｅｒ　５０　ｔｒｉａｌｓ　ａｒｅ　ｓｕｍｍａｒｉｚｅｄ　ｉｎ　Ｔａｂ．２．Ｔｈｅ　ｂｅｓｔ　ｒｅｓｕｌｔｓ　ａｒｅ　９　８　７　ｍａｒｋｅｄ　ｉｎ　ｂｏｌｄ．　Ｔａｂ．２　Ｃｏｍｐａｒｉｓｏｎ　ｏｆ　ｄｉｆｆｅｒｅｎｔ　ｃｌｕｓｔｅｒｉｎｇ　ａｐｐｒｏａｃｈｅｓ　ｏｎ　ｒｅａｌ　ｄａｔａ　ｓｅｔｓ　６　５　４　３　２　１　０　—１　），ｌ　（ｂ）　９　８　７　６　５　４　３　２　１　０　—１　４　—２　一Ｏ　２　ｙ１　４　６　８　１０　Ｓｅｖｅｒａｌ　ｔｒｅｎｄｓ　ａｒｅ　ａｐｐａｒｅｎｔ．Ｆｉｒｓｔ，ｔｈｅ　ｎｕｍｂｅｒｓ　ｏｆ　ｃｏｍ—　（ｃ）　ｐｏｎｅｎｔｓ　ｄｅｔｅｒｍｉｎｅｄ　ｂｙ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｍｅｔｈｏｄ　ａｒｅ　ｇｅｎｅｒａｌｌｙ　ｌｅｓｓ　ｔｈａｎ　ｔｈｏｓｅ　ｂｙ　ｔｈｅ　ｃｏｍｐａｒｅｄ　ｃｏｕｎｔｅｒｐａｒｔｓ．Ｔｈｉｓ　ｍａｙ　ｂｅ　ｄｕｅ　ｔｏ　ｔｈｅ　ｒｅａｓｏｎ　ｔｈａｔ　ｔｈｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ　ｏｆ　ａ　ｒｅａｌ　ｄａｔａ　ｓｅｔ　ｏｆｔｅｎ　ｄｏｅｓ　ｎｏｔ　ｓｔｒｉｃｔｌｙ　ｆｏｌｌｏｗ　ｔｈｅ　Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄ—　ｅ１．ａｎｄ　ｍｏｓｔ　ＧＭＭ—ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ　ａｐｐｒｏａｃｈｅｓ　ｔｅｎｄ　ｔｏ　ｇｅｎｅｒａｔｅ　ｍｏｒｅ　ｃｏｍｐｏｎｅｎｔｓ　ｔｈａｎ　ｎｅｃｅｓｓａｒｙ　ｉｎ　ｏｒｄｅｒ　ｔｏ　ｂｅｔ—　ｔｅｒ　ｆｉｔ　ｔｈｅ　ｄａｔａ．Ｈｏｗｅｖｅｒ．ｉｔ　ｉｓ　ｆｏｕｎｄ　ｔｈａｔ　ｔｈｅ　ＣＬ—ＭＭＬ　ｃａｎ　ｒｅｃｔｉｆｙ　ｔｈｅ　ｏｖｅｒ—ｆｉｔｔｉｎｇ　ｔｅｎｄｅｎｃｙ　ｏｆ　ｔｈｅ　ｃｏｍｐａｒｅｄ　ｍｅｔｈｏｄｓ　ｕｎｄｅｒ　ｓｕｃｈ　ｃｉｒｃｕｍｓｔａｎｃｅｓ．Ｔｈｉｓ　Ｃａｎ　ｂｅ　ｅｘｐｌａｉｎｅｄ　ｂｙ　ｔｈｅ　ｒｅａｓｏｎ　ｔｈａｔ　ｉｔ　ｔａｋｅｓ　ｔｈｅ　ｓｅｐａｒａｔｉｏｎ　ａｍｏｎｇ　ｃｏｍｐｏ’　ｎｅｎｔｓ　ｉｎｔｏ　ａｃｃｏｕｎｔ．Ｓｅｃｏｎｄｌｙ，ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｍｅｔｈｏｄ　ｙｉｅｌｄｓ　ｙｌ　（ｄ）　Ｆｉｇ．１　Ｔｙｐｉｃａｌ　ｃｌｕｓｔｅｒｉｎｇ　ｒｅｓｕｌｔｓ　ｏｆ　ｄｉｆｆｅｒｅｎｔ　ｍｅｔｈｏｄｓ　ｏｎ　ｔｈｅ　ｔｈｅ　ｍｏｓｔ　ａｃｃｕｒａｔｅ　ｒｅｓｕｌｔｓ　ａｍｏｎｇ　ａｌｌ　ｔｈｅ　ａｐｐｒｏａｃｈｅｓ　ｏｎ　ｔｈｅｓｅ　ｆｏｕｒ　ｄａｔａ　ｓｅｔｓ．Ｔｈｉｓ　ｊｕｓｔｉｉｆｅｓ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ａｐ—　ｐｒｏａｃｈ　ｃａｎ　ｅｓｔｉｍａｔｅ　ｔｈｅ　ＧＭＭ　ｐａｒａｍｅｔｅｒｓ　ｍｏｒｅ　ｐｒｏｐｅｒｌｙ　ｔｈａｎ　ｔｈｅ　ｃｏｍｐａｒｅｄ　ｏｎｅｓ．　ｓｙｎｔｈｅｔｉｃ　ｄａｔａ．（ａ）ＧＭＭ＋ＢＩＣ；（ｂ）ＧＭＭ＋ＭＩＭＬ；（ｃ）ＦＷＧＭＭ＋　ＩＬＣ；（ｄ）ＧＭＭ十ＣＬ－ＭＭＬ　ｗｅ　ａｌｓｏ　ｍｅａｓｕｒｅ　ｐｅｒｆｏｒｍａｎｃｅ　ｏｎ　ｆｏｕｒ　ｒｅａｌ－ｗｏｒｌｄ　ｄａｔａ　Ｉｎｓｅｔｓ　ｆｒｏｍ　ｔｈｅ　ＵＣＩｒｅｐｏ　ｈｅＴｈｅｎｕｍｂｅｒ　ｏｆ　ｌａｓｓｅｓ，ｔ．Ｍ……ｔ　：　。ｂｙ　　ｔａｋｅｉｖｎ皿．ｇ　ｔｈ　ｅ　ｃａｐ　ａｂｉ　　ｉｔｙ川ｏｆ　ｈｔ　ｅ　ｃｎａｄ　ｉｄ　ａｔｅ　ｔｖｖ　ｘ￣ｎｕｍｂｅｒ　ｏｆ　ｓａｍｐｌｅｓ　ａｎｄ　ｔｈｅ　ｄｉｍｅｎｓｉ０ｎａｌｉｔｙ　ｏｆ　ｅａｃｈ　ｄａｔａ　ｓｅ　，　．ｏｖｅｄ　ＧＭＭ—ｂ　ａｓｅｄ　ｃｌｕｓｔｅ　ａｎｎｒｏａｃｈ　ｉ　ｎ　ｉａｌｒ，ｕ￣Ｄｅｄ　ｍｐｒｔｈｅ　ｄｉｆｆｉｃｕｌｆｓｃｅｎａｒｉｏ　ｗｈｅｒｅ　ｔｈ。ｔｒｉ—　ｅｔｍｅｄｅｖｅｌｏ，－　’Ｇａｕｓｓｉａｎ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｃｌｕｓｔｅｒｉｎｇ　ｗｉｔｈ　ｃｏｍｐｌｅｔｅｄ　ｌｉｋｅｌｉｈｏｏｄ　ｍｉｎｉｍｕｍ　ｍｅｓｓａｇｅ　ｌｅｎｇｔｈ　ｃｒｉｔｅｒｉｏｎ　４７　ｂｕｔｉｏｎ　ｏｆ　ｄａｔａ　ｉＳ　ａｇａｉｎｓｔ　ｔｈｅ　ａｓｓｕｍｅｄ　ＧＭＭ．Ｔｈｅ　ｅｘｐｅｆｉ—　ｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ｍｅｔｈｏｄ　ｉｓ　ｎｏｔ　ｏｎｌｙ　［５］Ｍａｒｋｌｅｙ　Ｓ　Ｃ，Ｍｉｌｌｅｒ　Ｄ　Ｊ．Ｊｏｉｎｔ　ｐａｒｓｉｍｏｎｉｏｕｓ　ｍｏｄｅｌｉｎｇ　ａｎｄ　ｍｏｄｅｌ　ｏｒｄｅｒ　ｓｅｌｅｃｔｉｏｎ　ｆｏｒ　ｍｕｌｔｉｖａｒｉａｔｅ　Ｇａｕｓｓｉａｎ　ｍｉｘ—　ａｂｌｅ　ｔｏ　ｒｅｃｔｉｆｙ　ｔｈｅ　ｏｖｅｒ—ｆｉｔｔｉｎｇ　ｔｅｎｄｅｎｃｙ　ｏｆ　ｔｈｅ　ｃｏｍｐａｒｅｄ　ｍｅｔｈｏｄｓ　ｆｏｒ　ｐｅｒｆｏｒｍｉｎｇ　ｔｈｅ　ｍｏｄｅｌ　ｓｅｌｅｃｔｉｏｎ，ｂｕｔ　ａｌＳＯ　ａｂｌｅ　ｔｏ　ｏｂｔｍｎ　ｈｉｇｈｅｒ　ｃｌｕｓｔｅｒｉｎｇ　ａｃｃｕｒａｃｙ　ｃｏｍｐａｒｅｄ　ｔｏ　ｔｈｅ　ｅｘｉｓｔ—　ｔｕｒｅｓ［Ｊ］．ＩＥＥＥ　Ｊｏｕｒｎａｌ　ｏｆ　Ｓｅｌｅｃｔｅｄ　Ｔｏｐｉｃｓ　ｉｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ，２０１０，４（３）：５４８—５５９．　『６］Ｌｉ　Ｙ，Ｄｏｎｇ　Ｍ，Ｈｕａ　Ｊ．Ｌｏｃａｌｉｚｅｄ　ｆｅａｔｕｒｅ　ｓｅｌｅｃｔｉｏｎ　ｆｏｒ　ｉｎｇ　ｍｅｔｈｏｄｓ．　ｃｌｕｓｔｅｒｉｎｇ［Ｊ］．Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ　Ｌｅｔｔｅｒｓ，２００８，２９　（１）：１０—１８．　［７］ＡｌｌｉＨ　Ｍ　Ｓ，Ｚｉｏｕ　Ｄ，Ｂｏｕｇｕｉｌａ　Ｎ，ｅｔ　ａ１．Ｉｍａｇｅ　ａｎｄ　ｖｉｄｅｏ　ｓｅｇｍｅｎｔａｔｉｏｎ　ｂｙ　ｃｏｍｂｉｎｉｎｇ　ｕｎｓｕｐｅｒｖｉｓｅｄ　ｇｅｎｅｒａｌｉｚｅｄ　［１］Ｚｅｎｇ　Ｈ，Ｃｈｅｕｎｇ　Ｙ　Ｍ．Ｆｅａｔｕｒｅ　ｓｅｌｅｃｔｉｏｎ　ａｎｄ　ｋｅｒｎｅｌ　ｌｅａｒｎｉｎｇ　ｆｏｒ　ｌｏｃａｌ　ｌｅａｒｎｉｎｇ　ｂａｓｅｄ　ｃｌｕｓｔｅｒｉｎｇ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｔｔｅｒｎ　Ａｎａｌｙｓｉｓ　ａｎｄ　Ｍａｃｈｉｎｅ　Ｉｎｔｅｌｌｉ—　Ｇａｕｓｓｉｎ　ｍｉａｘｔｕｒｅ　ｍｏｄｅｌｉｎｇ　ａｎｄ　ｆｅａｔｕｒｅ　ｓｅｌｅｃｔｉｏｎ［Ｊ］．　ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｃｉｒｃｕｉｔｓ　ａｎｄ　Ｓｙｓｔｅｍｓ　ｆｏｒ　Ｖｉｄｅｏ　ｇｅｎｃｅ，２０１１，３３（８）：１５３２—１５４７．　Ｔｅｃｈｎｏｌｏｇｙ，２０１０，２０（１０）：１３７３—１３７７．　［８］Ｆａｎ　Ｗ，Ｂｏｕｇｕｉｌａ　Ｎ，Ｚｉｏｕ　Ｄ，Ｕｎｓｕｐｅｒｖｉｓｅｄ　ｈｙｂｒｉｄ　ｆｅａ—　ｕｒｅ　ｅｘＶａｃｔｔｉｏｎ　ｓｅｌｅｃｔｉｏｎ　ｆｏｒ　ｈｉｇｈ－・ｉｍｅｎｓｉｏｎａｌｄ　ｎｏｎ－－Ｇａｕｓｓｉ・・　［２］Ｊｌａｎ　Ａ　Ｋ．Ｄａｔａ　ｃｌｕｓｔｅｉｒｎｇ：５０　ｙｅａｒｓ　ｂｅｙｏｎｄ　Ｋ－ｍｅａｎｓ　［Ｊ］．Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ　Ｌｅｔｔｅｒｓ，２０１０，３１（８）：６５１—　６６６．　ａｎ　ｄａｔａ　ｃｌｕｓｔｅｒｉｎｇ　ｗｉｔｈ　ｖａｒｉａｔｉｏｎａｌ　ｉｎｆｅｒｅｎｃｅ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｋｎｏｗｌｅｄｇｅ　ａｎｄ　Ｄａｔａ　Ｅｎｇｉｎｅｅｒｉｎｇ，２０１２，　ｉｎ　ｐｒｅｓｓ．　［３］Ｂｏｕｇｕｉｌａ　Ｎ，Ａｌｍａｋａｄｍｅｈ　Ｋ，Ｂｏｕｔｅｍｅｄｊｅｔ　Ｓ．Ａ　ｆｉｎｉｔｅ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌ　ｆｏｒ　ｓｉｍｕｌｔａｎｅｏｕｓ　ｈｉｇｈ・－ｄｉｍｅｎｓｉｏｎａｌ　ｃｌｕｓｔｅ－－　ｉｒｎｇ，ｌｏｃａｌｉｚｅｄ　ｆｅａｔｕｒｅ　ｓｅｌｅｃｔｉｏｎ　ｎｄ　ａｏｕｔｌｉｅｒ　ｒ￣ｅｃｔｉｏｎ［Ｊ］．　Ｅｘｐｅｒｔ　Ｓｙｓｔｅｍｓ　ｗｉｔｈ　Ａｐｐｌｉｃａｔｉｏｎｓ，２０１２，３９（７）：６６４１—　６６５６．　［９］Ｆｉｇｕｅｉｒｅｄｏ　Ｍ　Ａ　Ｆ，Ｊａｉｎ　Ａ　Ｋ．Ｕｎｓｕｐｅｒｖｉｓｅｄ　ｌｅａｒｎｉｎｇ　ｏｆ　ｉｆｎｉｔｅ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｔｔｅｒｎ　Ａｎａｌｙｓｉｓ　ａｎｄ　Ｍａｃｈｉｎｅ　Ｉｎｔｅｌｌｉｇｅｎｃｅ，２００２，２４（３）：３８１—　３９６．　［４］Ｌａｗ　Ｍ　Ｈ　Ｃ，Ｆｉｇｕｅｉｒｅｄｏ　Ｍ　Ａ　Ｔ，Ｊｌｎ　ａＡ　Ｋ．Ｓｉｍｕｌｔｎｅｏｕｓａ　［１０］Ｗａｌｌａｃｅ　Ｃ　Ｓ，Ｄｏｗｅ　Ｄ　Ｌ．ＭＭＬ　ｃｌｕｓｔｅｒｉｎｇ　ｏｆ　ｍｕｌｔｉ—ｓｔａｔｅ，　ｆｅａｔｕｒｅ　ｓｅｌｅｃｔｉｏｎ　ａｎｄ　ｃｌｕｓｔｅｒｉｎｇ　ｕｓｉｎｇ　ｍｉｘｔｕｒｅ　ｍｏｄｅｌｓ　Ｐｏｉｓｓｏｎ，ｖｏｎ　Ｍｉｓｅｓ　ｃｉｒｃｕｌａｒ　ａｎｄ　Ｇａｕｓｓｉａｎ　ｄｉｓｔｒｉｂｕｔｉｏｎｓ　［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｔｔｅｒｎ　Ａｎａｌｙｓｉｓ　ａｎｄ　Ｍａｃｈｉｎｅ　Ｉｎｔｅｌｌｉｇｅｎｃｅ，２００４，２６（９）：１１５４—１１６６．　［Ｊ］．Ｓｔａｔｉｓｔｉｃｓ　ａｎｄ　Ｃｏｍｐｕｔｉｎｇ，２０００，１０（１）：７３—８３．　基于完整似然最短信息长度准则的高斯混合模型聚类　曾　洪　卢　伟　宋爱国　（‘东南大学仪器科学与工程学院，南京２１００９６）　（　南京农业大学工学院，南京２１００３１）　摘要：针对数据真实的概率分布不符合事先假设的高斯混合模型的情形，提出了一种鲁棒的基于高斯混合　模型的聚类方法．首先，提出了一种新的模型选择准则，即完整似然最短信息长度准则．该准则不仅能衡量　模型对数据的拟合优度，还能度量该模型对数据分组的性能．然后，将该准则作为聚类的代价函数，提出了　一种新的期望最大化算法来估计模型参数．与标准的期望最大化算法相比，新算法能较好地避免不理想的　局部最优解．实验结果表明：当数据概率分布模型不符合假设的高斯混合模型时，所提方法可克服现有的基　于高斯混合模型聚类方法过拟合的缺点，鲁棒地得到准确的聚类结果．　关键词：高斯混合模型；非高斯分布；模型选择；期望最大化算法；完整似然最短信息长度准则　中图分类号：ＴＰＩ８１　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文