• 我要登录|
  • 免费注册
    |
  • 我的丁香通
    • 企业机构:
    • 成为企业机构
    • 个人用户:
    • 个人中心
  • 移动端
    移动端
丁香通 logo丁香实验_LOGO
搜实验

    大家都在搜

      大家都在搜

        0 人通过求购买到了急需的产品
        免费发布求购
        发布求购

        R语言层次聚类如何选择计算距离的方法,及聚类的方法

        相关实验:基于 SPSS 的卡方检验

        user-title

        满天都是小星星F

        最近要做聚类分析,如果收集的变量都是二分类变量,那我聚类是计算距离还是用欧式距离吗,方法,平均,ward,完全选择哪种好?求解答!谢谢!

        wx-share
        分享

        3 个回答

        user-title

        土井挞克树

        有帮助

        做聚类分析,如果收集的变量都是二分类变量,可以计算欧式距离

        user-title

        loveliufudan

        有帮助

        在进行聚类分析时,如果您的变量都是二分类变量,可以使用欧式距离来计算变量之间的距离。欧式距离可以用来度量连续变量之间的距离,但也可以用于二分类变量。

        对于聚类算法的选择,可以根据数据的特点和研究目的进行选择。下面是几种常见的聚类算法及其特点:

        K-means算法:K-means算法是一种基于距离的聚类算法,它将数据分成K个簇,并尽可能地使每个簇内的点相似。K-means算法适用于数据量较大的情况,但需要指定簇的个数K。

        层次聚类算法:层次聚类算法是一种基于距离的聚类算法,可以将数据分成树状结构的层次,从而形成一系列簇。层次聚类算法包括方法、平均、Ward、完全连接等多种方法,其中Ward方法对于二分类变量比较适用。Ward方法在计算簇的距离时,考虑了簇内方差的增加量,可以有效地控制簇内方差的增加,从而得到更加稳定的聚类结果。

        DBSCAN算法:DBSCAN算法是一种基于密度的聚类算法,它将数据分成具有足够密度的区域,并将低密度区域视为噪声。DBSCAN算法不需要指定簇的个数,但需要指定距离阈值和密度阈值。

        综上所述,如果您的变量都是二分类变量,可以考虑使用欧式距离来计算距离,同时使用Ward方法进行层次聚类。不过具体的选择还需要结合您的数据特点和研究目的来进行。

        user-title

        huarenqiang5

        有帮助

        是二分类变量的话,聚类是欧式距离。

        ad image
        提问
        扫一扫
        丁香实验小程序二维码
        实验小助手
        丁香实验公众号二维码
        扫码领资料
        反馈
        TOP
        打开小程序