当前位置:首页 > 论文知识 » 正文

在生产均衡点上有(使用二分搜索算法在1000个有序)

目录:

在生产均衡点上有

使用二分搜索算法在1000个有序

在生产均衡点上有

在生产均衡点上有

1、目的:<br>本研究希望提出一种新的改进的最小化算法,在保证整体均衡性的前提下,实现分层因素内部的均衡性,以满足实际需求,为临床试验动态随机化提供一种新的有效工具。<br>方法:<br>我们希望提出一种新的算法公式,和之前的最小化法算法相比。并不会从根本上改变其算法,而是在保留之前算法核心的同时,将中心内部均衡性的算法公式也统一考虑到最后的算法模型中。这里需要注意的是,最后的分组结果的判定是有整体患者组间的不均衡性和新一位患者所在中心内部的不均衡性两部分组成的。避免只考虑其中一个方面带来的潜在问题。在保证整体均衡性的前提下同时保证各中心内部也保持均衡,同时通过整体均衡性来控制中心均衡性防止算法和盲底的泄露。<br>采用Monte Carlo技术,模拟比较所提出的改进最小化算法与其它常用的随机化算法的随机化效果。模拟工具使用SAS4,随机数字的产生采用均匀分布的ranuni随机数,产生二分类的控制因素。中心数为10,区组长度为6,研究的样本量设置为每个中心12例,30例,60例,90例四种情况,患者比例为均为1∶1。控制因素数量考虑两种情况,及分别考虑有3个控制因素和6个控制因素的情况。因为模拟时花费的时间较长。因此在分析时设定的模拟次数为1000次。<br>在分层区组随机方法时,中心变量当作分层分析的分层元素。最小化的方法衡量两组不均衡的程度的算法采用极差法,各因素之间权重相等。分配概率设置为0.8和0.2。动态均衡性的算法假设所有因素的组间阈值大小均为4。<br>评价指标为最终整体入组者组间差值及控制因素最小组间卡方检验P值的PP2P50、P75和P99及分中心内部相应指标。因为要比较在随机过程中出现的最极端情况,因此中心内部的组间差值选取10个中心内差值最大的中心,控制因素的最小值也选取10个中心内部3个或6个控制因素P值最小的值。如果在检验中发现有格子数小于5的情况,则换用确切概率法的P值替代卡方检验P值。<br>结果:<br>不同控制因素的结果比较<br>控制因素为3个和6个的结果类似。在不同控制因素数量下6种方法的优劣程度没有发生变化。<br>组间例数均衡性:完全随机化的整体组间例数均衡性和中心内部组间例数均衡性结果类似。4种动态性随机化方法的整体组间例数在控制因素为3个时均略微差于控制因素为6个时的情况,除分中心随机化外中心内部组间例数均衡性在控制因素为3个时也均略微差于控制因素为6个时的情况,分中心随机化的结果几乎没有变化。<br>组间控制因素均衡性:6种随机化方法的整体控制因素和中心内部控制因素的均衡性在控制因素为3个时均略优于控制因素为6个时的情况。<br>整体均衡性:完全随机化法的结果显示随着样本量的增加组间差值均值也呈现比较明显的增加趋势。其余的各百分位数也呈现同样的趋势。整体患者的控制因素P值结果也不太理想,且随着样本量的增加,P值的大小几乎没有改变。中心分层区组化的结果反映了其算法本身具有的特点。因为随机区组的作用,所以组间的差值可以保证在每个区组内部都均衡,从而保证整体组间的均衡。在整体患者的控制因素P值结果显示与简单随机化的结果几乎没有差异,且随着样本量的增加,P值的大小也几乎没有改变。原始最小化的结果显示在整体组间例数的均衡性上,最小化的方法很明显优于简单随机化,且随着样本量的增加,结果也几乎没有改变。与中心分层区组化相比,虽然不能保证所有的结果都能在组间均衡,但是其P95与P99都非常小,表示试验组与对照组的例数偏差都非常小且是可以接受的。在整体患者的控制因素P值结果显示所有样本量的P值均显著大于0.05,且随着样本量的增加,P值的均值也显示增长的趋势。且在各个样本量的情况下,P1都远远大于0.05,在6种随机方法种原始最小化的方法是最优的。动态均衡性随机化的结果显示在整体组间例数的均衡性上,该方法是明显优于简单随机化的,与原始最小化方法相比,动态均衡性算法稍微差一点。在整体患者的控制因素P值结果显示该方法与简单随机化和分层区组随机化相比有明显优势,且随着样本量的增加P值的均值及其他百分位数也显示增长的趋势。与原始最小化方法相比,该方法在各个样本量下均有降低。分中心随机化在各个分中心均开展各自方随机化后的时候整体均衡性还是或多或少的收到了影响,在整体组间差值均值的比较上其结果是6种方法上仅优于简单随机化的。在整体控制因素的均衡性上,分中心随机化的结果也仅仅优于简单随机化与分层区组随机化,是4种动态随机化方法中最差的一个。改进最小化的方法显示组间差值均值随着样本量的增加几乎没有变化,其余的各百分位数也几乎没有改变。与原始最小化和动态均衡性算法相比,其结果都比较类似。整体患者的控制因素P值结果也比较理想,是6种方法中仅次于原始最小化的,且随着样本量的增加,P值得大小也呈现增长趋势。<br>分层因素内部均衡性:完全随机化法的结果随着样本量的增加组间差值均值也呈现比较明显的增加趋势。其余的各百分位数也呈现同样的趋势。整体患者的控制因素P值结果同样也不太理想。中心分层区组化的保证分中心整体组间的均衡,在6种方法中此项指标中心分层区组化的结果是最优的。在整体患者的控制因素P值结果显示与简单随机化的结果几乎没有差异。原始最小化的结果显示在分中心组间例数的均衡性上,最小化的方法与简单随机化相比无论是均值还是各个百分位数均没有优势,甚至没有差异。且随着样本量的增加,组间差值也呈现比较明显的上升趋势,在控制因素P值结果也是不令人满意的。动态均衡性随机化的结果显示在分中心组间例数的均衡性上,该方法是明显优于简单随机化和原始最小化方法的。在控制因素的均衡性上,动态均衡性算法与简单随机化和原始最小化法相比竟然没有差异,且趋势也完全一样。进一步佐证了在随机化中单纯控制整体各个因素的组间差异和分中心组间例数差值是不能改变分中心各个控制因素的组间均衡性的,从而OO了与动态随机化类似的一系列相关算法在控制中心均衡性时的应用。分中心随机化在中心组间差值均值的比较上其结果是6种方法中最优的,而且随着样本量的增加,该方法的组间均衡性也几乎不受影响,说明控制性是非常明显的。在中心控制因素的均衡性上,其结果也是最优的。改进最小化的方法显示组间差值均值随着样本量的增加虽然呈现些许增加趋势,但是增加趋势都不明显,其余的各百分位数也几乎没有改变。在6种方法中也是仅次于分中心随机化的,且明显的优于原始最小化与动态均衡性算法,很好的控制了分中心组间例数的均衡性。分中心患者的控制因素P值结果也比较理想,也是6种方法中仅次于分中心随机化,且随着样本量的增加,P值得大小也呈现增长趋势,其P50的结果也都明显大于0.05。<br>结论:<br>改进最小化法同时控制了整体均衡性和分层因素内部均衡性,其均衡性效果优于其它5种方法。同时,该方法在原理上保留了最小化算法的核心理论,有利于在目前大部分OO随机化系统中进行推广。

使用二分搜索算法在1000个有序

使用二分搜索算法在1000个有序

1、聚类分析在模式识别、数据挖掘等领域,起着非常重要的作用。近些年来,随着数据挖掘研究的深入,聚类分析日益受到重视[1]。 K - means 算法是较常用的聚类算法之一,其中聚类中心的初始化对该算法的性能影响很大。若选取的初始聚类中心不合适,将不仅影响收敛速度,还有可能使算法陷入局部最优,但目前许多参考文献往往绕开该问题。迄今为止,对聚类算法中聚类中心初始化的研究相对较少,且没有简单通用的好方案,重复不同的随机选择似乎成为了事实上的方法[2]。 Pena 等对目前常用的初始化算法从聚类质量(有效性)、聚类方法的敏感性(鲁棒性)和收敛速度(即效率)等方面进行了实验比较研究[3],结果表明随机初始化方法和 KaufOOn 方法[4](KA)在有效性和鲁棒性方面均优于 Forgy 方法[5](FA)和 Macqueen 方法[6](MA),其中 KA 在收敛速度方面优于随机化方法。

2、最近,Bradly 和 Fayyad 等人对目前的一些初始点选择的方法进行了评述,并指出“在离散数据上采用 EM 算法和随机的初始化方法相比,并没有什么提高” [7,8]?。在文献[7]中,其算法思想:对数据进行随机抽样,例如,抽取原数据的 1 %,在抽样后的数据上采用 EM 算法进行聚类,得到一组聚类中心,,重复上述过程(再重新抽样和进行聚类),假设重复 n 次,那么就得到 n 组聚类中心;对上述所有采样的数据,利用 n 组聚类中心采用 K - means 算法再进行聚类,选取性能最佳的一组,作为最终的初始聚类中心。从他们OO所提供的结果来看,该方法能够适用于大规模的数据,并且总体性能较好。

3、Khan 和?AhOOd 提出了一种基于属性的初始化方法[9]。其方法的主要思想是,数据点的每个属性可以为初始化提供信息,利用这一点,获得比类别数多的初始聚类中心,再进行合并,使得初始聚类中心的个数等于类别数。实验结果显示,该方法的性能优于随机化的初始化方法。

4、笔者提出了基于层次方法的聚类中心初始化方法(HIKM),通过分层聚类,找到较好的初始聚类中心。该算法采用误差平方和最小作为聚类测度,采用金字塔结构,对原始数据进行层层抽样,在抽样后的数据上进行聚类。尽管抽样后数据有所减少,但对 K - means 算法而言,原始信息却损失较少,抽样后的数据能较好反映抽样前的信息,同时能够抑制噪声。经过一定次数的抽样后,数据量大大减少,聚类的收敛速度很快。由于上述聚类中心是基于抽样后数据的,而聚类算法所需的是原始数据的初始聚类中心,因此必须在抽样后所得初始聚类中心的基础上,再去求取原始数据的初始聚类中心。

后台-系统设置-扩展变量-手机广告位-内容正文底部

本文标签:中心  均衡  随机  方法  控制

<< 上一篇 下一篇 >>

  • 评论(
  • 赞助本站

赞助团论文网
留言与评论(共有 0 条评论)
   
验证码:

相关文章

随机文章

标签列表

最近发表

    热门文章 | 最新文章 | 随机文章

最新留言

首页 论文知识 教育论文 毕业论文 教学论文 经济学 管理学 职称论文 法学 理学 医学 社会学 物理学 文献 工程论文 学位论文 研究论文

Powered 团论文网 版权所有 备案号:粤ICP备2022136924号-2统计代码

全站搜索