一、一类密度估计的r阶平均相合性(论文文献综述)
王鹏鹏[1](2021)在《复杂数据下部分线性变系数模型的变量选择》文中研究指明本文针对部分线性变系数模型,研究参数分量的变量选择。该模型既含有线性模型作为参数分量,又含有变系数模型作为非参数函数,是两者的结合。在理论研究和实际数据分析中,经常会遇到诸如缺失数据、测量误差数据和纵向数据等复杂数据。变量选择可以从众多的潜变量中筛选出重要变量的同时,给出未知参数向量的估计。因此,在复杂数据下研究部分线性变系数模型的变量选择具有一定的理论和实际意义。本文主要研究内容有:(1)在因变量缺失时,研究了高维数据下非参数部分带有测量误差的部分线性变系数模型的变量选择问题。基于局部偏差修正的剖面最小二乘方法和SCAD惩罚函数,分别提出了完全数据和借补方法下的两种变量选择方法。在一定的假设条件下,建立了参数估计量的一致性、稀疏性和渐近正态性等大样本性质。模拟实验表明了所提两种变量选择方法的有效性,且借补方法是优于完全数据的。(2)在纵向数据下,研究了非参数部分带有测量误差的部分线性变系数模型的变量选择问题。基于B样条基函数,对模型中的变系数函数逼近,建立了偏差修正的广义估计方程,构造了偏差修正的惩罚二次推断目标函数,提出了变量选择方法。在一定的假设条件下,证明了非参数估计量的一致性、参数估计量的稀疏性和渐近正态性等渐近性质。模拟实验结果表明了所提偏差修正的变量选择方法的有效性。
徐萍[2](2021)在《条件非参数独立筛选及在基因数据中的应用》文中研究说明在遗传学研究中,全基因组关联分析(GWAS)是研究复杂疾病与基因关系的一种常用分析方法,该方法通过研究目标基因与特定疾病之间的相关关系以此找出与疾病关联性较强的基因.自从2005年Klein等人通过基因关联分析成功找出影响黄斑变性的基因,已陆续帮助科学家筛选出与冠心病、肥胖、2型糖尿病、精神分裂症等复杂遗传疾病相关的基因点位.随着基因分型与测序技术快速发展,使得获取成千上万基因点位数据变为可能.这就意味着我们将面临高维数据问题,这使得传统的统计理论与方法受到较大的挑战.在实际的高维基因数据研究中,基因与基因、基因与环境(例如,年龄、性别等)的交互作用都会对某种疾病产生影响,传统方式只考虑构造单个基因位点与疾病之间的边际关系,忽略了这种交互作用,这可能会导致某些误判,会降低基因筛选的准确度.同时在基因测序过程中,每个基因点位基因型的精确测量是比较困难的,通常情况我们只知道该位点三种基因型的概率,其真实的基因型无法获得.已有的关联分析方法主要考虑线性模型,模型结构的假定限制了其适用范围.非参数可加模型可以不用对模型结构进行假定,具有更强的适用性.为此,本论文考虑已知某些重要变量情形下,基于非参数可加模型对基因型不确定数据进行致病基因筛选,并提出了条件非参数筛选(CNIS)方法.在一些适当的条件下,证明了该方法第一阶段的筛选具有一致性筛选性质,能以概率1保留重要的变量;第二阶段的变量选择也具有良好的相合性.根据Monte Carlo数据模拟结果表明,该方法相较于NIS方法有更好的表现.
程浩洋[3](2021)在《若干重要数据类型的降维方法研究》文中提出近年来,随着数据科学和信息技术的发展,各领域所能采集与分析的数据的体量和维度都变得越来越大。海量的数据包含着大量的信息,使得模型预测的准确度能更高,但同时也给统计分析与计算带来了新的挑战。因为大数据中虽然包含着我们所感兴趣的信息,但同时也有着大量冗余的信息,而冗余的信息不仅会影响模型的精度,同时也增加了计算复杂度。因此发展相应的降维方法是处理该问题的关键之处。降维方法中有两条重要的研究方向,一是充分降维,二是变量选择。前者在尽可能减少信息损失的情况下寻找一系列的变量组合,后者目的在于筛选重要的变量。现今关于这两类方法的研究已有许多,如基于“逆回归”所发展的充分降维方法和基于Lasso所发展的变量选择方法,而这些方法针对的主要是正常的批量数据以及线性模型。对一些具有其他特点的数据,该方面的研究则相对较少,如在线数据、异方差数据以及半参数模型等等。本文尝试着对这些具有各种特点的数据与模型进行研究,并提出针对性的充分降维与变量选择方法。在第二章中,我们提出了一种在线稀疏切片逆回归降维方法。现有的在线降维方法主要集中在维数p较小的情况下,而本章论证了当维数p较大时,我们的方法可以获得更好的统计精度和计算速度。该方法包括两个重要步骤:一是扩展在线主成分分析,迭代获取核矩阵的特征值与特征向量;二是利用截断梯度实现在线 L1正则化。本章分析了扩展的 CCIPCA(Candid covari ance-free incremental principal component analysis)算法的收敛性。在模拟研究和实证分析中,通过与现有的几种方法进行比较,我们展示了在线稀疏切片逆回归的有效性。在第三章中,针对具有异方差的高维数据,我们提出了一种新的充分降维方法。基于主分位数回归(Principal quantile regression;PQR)方法得到的候选矩阵,我们使用该矩阵的特征向量构造新的人工响应变量,然后应用Lasso方法得到稀疏降维方向。而对于“高维度小样本”的情形,即p>>n,我们采用主投影方法将原问题转换为低维子空间的降维问题。我们在一定条件下证明了所得估计量的相合性,并通过模拟研究和实证分析展示了该方法在高维异方差数据中的优势。在第四章中,由于分位数回归和距离协方差分别适用于异方差数据和充分降维问题,所以我们提出了一种基于分位数距离协方差的充分降维方法。我们的方法不依赖于线性条件,并且对异方差具有鲁棒性。在一定条件下,我们证明所提方法估计量的相合性。为了验证该方法的有效性,我们在模拟研究和实证分析中与几种现有的充分降维方法进行比较。在第五章中,将广义半参数理论应用至非线性充分降维问题中,我们可得到一组不依赖于线性条件和方差常数条件的非线性充分降维方法。我们讨论了该非线性充分降维方法估计量的相合性,并以核切片逆回归方法为例,给出了其估计方程与求解过程。除此之外,我们通过模拟研究和实证分析,展示了我们方法在线性条件和方差常数条件不满足时的有效性。在第六章中,我们研究了高维部分线性模型的变量选择和估计问题,并假设非参数部分位于再生核Hilbert空间(RKHS)中以及参数分量的回归系数向量是稀疏的。我们采用双惩罚估计来处理该问题,即利用RKHS上的平方半范数对非参数部分进行粗糙惩罚,利用具有oracle属性的惩罚项来使参数部分实现稀疏性。在一定条件下,我们证明了参数估计量的收敛性和相合性,以及变量选择的相合性。此外,我们还给出了非零系数估计量的渐近oracle性质。通过模拟和实证分析,我们验证了所提方法的性能。
王燕[4](2020)在《相依误差下若干统计模型中两类估计量的渐近性质》文中研究表明数理统计是统计分析的基础,由于实际生产的需要,采用数学分析方法建立的统计模型逐渐成为统计学科研究的焦点之一.非参数统计是统计学的一个重要分支,而绝大多数非参数统计方法主要基于统计量的某种渐近性质,故统计量的渐近性质是解决一些统计模型中相关问题的关键.本文主要研究EV回归模型,半参数回归模型和非线性回归模型中未知参数估计量的渐近理论,其中涉及到最小二乘估计量和GM估计量.可以指出的是:当样本量不大时,GM估计量(一种带有积分的估计量)相比PC估计量具有更高的准确性.我们讨论END随机变量序列加权和的完全f-矩收敛性的问题,此结果改进和推广了已有结果,继而得到END随机误差下,EV回归模型中未知参数最小二乘估计量的完全相合性,并给出数值模拟.我们从模型出发,探究φ,混合误差下,半参数回归模型中未知参数最小二乘估计量的矩相合性,展现较弱矩条件下的相合性结果;同时,我们也给出了数值模拟.然后探究在α混合误差下,非线性回归模型中GM估计量的渐近结果,包括矩相合性和渐近正态性,并根据结果给出符合理论条件的数据模拟.本文的结果完善和丰富了相依或混合随机变量序列的概率极限理论与重要统计模型中统计量的渐近理论,具有重要的实际意义.
吴燚[5](2020)在《相依误差下几类统计模型的大样本性质》文中研究说明回归模型在很多实际领域中都有极其重要的应用,至今已有多种重要且实用的模型被提出,但在相依场合下对于这些模型的研究尚未完善.本篇论文主要在相依样本下讨论几类统计模型中估计量的大样本性质.首先,考虑如下多元线性回归模型:#12其中xi=(xi1,…,xid)T,1≤i ≤是设计向量,y1,…,yn是观测值,∈1,∈2,…,∈n是均值为0的随机误差,β=(β1,…,βd)T是待估参数.在合适的条件下,我们建立了m-END误差下未知参数β的最小二乘估计的弱相合性及完全相合性,所得结果补充并推广了胡舒合等[6]以及Yang等[7]的结果.其次,考虑如下非参数回归模型:Yi=g(xni)+∈ni,i=1,...,n,n≥1其中g(x)为定义在Rd上的未知函数,d ≥ 1,xni是已知的d维向量,∈ni是均值为0的随机误差且对每个n≥ 1,(∈n1,∈n2,…,∈nn)和(∈1,∈2,…,∈n)有相同的联合分布.我们在END误差下建立了非参数回归模型中P-C估计的强相合性、完全相合性以及矩相合性,所得结果推广并改进了Priestley与Chao[8]及杨善朝与王岳宝[10]的结果;随后,我们建立了ANA误差下一般加权估计量的渐近正态性与Berry-Esseen界,该结果说明在适当的条件下,ANA误差下一般加权估计量的Berry-Esseen界也可达到Yang[127]关于NA的速度;最后,我们还考虑了m-ANA误差下一般加权估计量的完全相合性.随后,我们考虑部分线性回归模型:#12其中xi和ti是设计点列,β是待估的未知参数,g(·)是定义在区间[0,1]上的未知函数,yi是观测值,Vi是均值为0的随机误差.在误差为由α-混合随机变量产生的线性过程下,我们建立了此部分线性回归模型中估计量的渐近正态性与Berry-Esseen界,此结果推广了Liang与Fan[128]的相应结果.我们还考虑了如下更加宽泛的部分线性回归模型:Y(j)(xin,tin)=tinβ+g(xin)+e(i)(xin),1 ≤j ≤k,1 ≤i ≤n,其中tin∈R,xin∈Rd都是非随机的设计点列,β是未知参数,g(·)为定义在A(A(?)Rd)上未知的连续函数,e(j)(xin)是随机误差,Y(i)(xin,tin)代表在点xin与tin上可观测的第j个响应变量.在m-END误差下,我们建立了此模型中参数的最小二乘估计量和非参数部分的加权估计量的强相合性、完全相合性以及矩相合性等结果,这些结果推广并改进了文献[33]-[37]的结果.接着,我们还研究了如下简单线性EV回归模型:ηi=η+βxi+εi,ξ=xi+δi,1 ≤i≤ n,其中θ,β,x1,x2,…都是未知参数,(ε1,δ1),(ε2,δ2),…为随机向量,ξi,ηi,i=1,2,...是观测值.我们首先在非常宽泛的条件下建立了 WOD随机变量加权和的完全收敛性,此结果只要求控制系数为多项式增长即可,并且矩条件与控制系数没有任何关系;在此结果的基础上,我们进一步得到了WOD误差下EV回归模型中最小二乘估计量的完全相合性的收敛速度的非常一般结果,由此还能在更弱的条件下得到完全相合性.最后,考虑如下异方差的部分线性EV回归模型:yi=ξiβ+g(ti)+εi,xi=ξi+μi,其中εi=σiei,σi2=f(ui),(ξi,ti,ui)是设计点列,(ti,xi,yi)为观测样本,ξi为不可观测的潜在变量,yi为响应变量,xi是可观测的且带有均值为零的测量误差μi,ei是均值为零的误差,β ∈R是未知的斜率参数,f(·)及g(·)都是定义在闭区间[0,1]上的未知函数.在WOD误差下,我们建立了部分线性EV回归模型中最小二乘估计量与加权最小二乘估计量的强相合性及其收敛速度的一般结果.此结果中模型误差及测量误差都可以是WOD的,它们的控制系数也都可以是多项式增长的,并且矩条件仍然与控制系数没有任何关系.本章结果显着地改进和推广了 Zhang与Wang[5的结果.
蔡巍[6](2019)在《网络数据的判别分析和因子模型》文中研究表明随着信息技术的高速发展,人类社会逐渐步入复杂网络时代.随之而来,我们生产生活中涌现出大量的网络型数据.对于这种新型数据的分析,是摆在如今科研工作者面前的一大难题.在统计学中,关于网络型数据的分析一直是围绕着两大问题展开的,即探究网络中信息的传播方式以及揭示网络结构的生成机制.本文的工作同样围绕这两个问题展开.首先,关于第一个问题,我们建立了一个利用网络结构进行分类的统计模型,称为网络线性判别分析(NLDA).NLDA模型同时考虑到了协变量信息和网络信息,对于一个类未知的节点能够利用两部分信息进行分类.理论上,我们研究了该分类模型的理论误分类率并且在相当温和的条件下给出了理论误分类率的上界.此外,对于常见的稀疏网络结构,我们在不同的稀疏性假设条件下,研究了NLDA模型的相应的渐近行为.为了研究新提出的分类方法在有限样本上的表现,我们设计了一系列的模拟实验,并用一个收集自新浪微博的真实数据集来展示该模型的效果.其次,关于第二个问题的研究,我们基于高维因子分析模型,构建了一个关于连续型网络数据的生成模型.该模型假定网络的生成受到潜在的因子结构所影响,其中主要包括潜在的节点发出者和接收者效应以及节点间更高阶的依赖关系.理论上,在一定的假设下我们得到了模型中参数的可识别性.并进一步证明了参数极大似然估计的相合性和渐近正态性.此外,我们也设计了一系列模拟实验评估该模型在有限样本上的表现.
聂彩玲[7](2019)在《NSD随机序列下非参数估计的相合性》文中提出负超可加相依(NSD)随机序列包含负相协(NA)随机序列,且在实际问题中有很多很重要的应用,如在社会科学、金融、保险、精算等都有应用.本文主要研究NSD样本序列未知密度函数的密度核估计、非参数回归函数估计及最近邻密度估计的相合性,如:弱相合性,强相合性,一致强相合性.本文所得结果是现有文献中独立样本或其它相依样本相关结果的推广.具体研究内容如下:第一章:介绍了未知密度估计的研究背景及方法、NSD随机序列国内外研究现状和相合性的分类,并给出了几个重要的不等式和引理.第二章:运用NSD序列的Bernstein不等式、Rosenthal不等式、性质得到未知密度函数核估计的逐点相合性、一致相合性以及r阶矩相合性.第三章:在随机误差为负超可加阵列的情况下,研究了非参数回归函数估计的问题.在一定的条件下得到了非参数回归函数估计的强相合性,并用R软件做出了估计量的数值模拟图.第四章:由NSD序列的不等式与性质,在适当的条件下得到了NSD样本未知密度函数最近邻密度估计的弱相合性、强相合性及一致强相合性.
韩忠成[8](2019)在《非参数模型的稳健有效估计及其应用研究》文中研究说明回归模型一般包括参数和非参数回归模型,其中参数回归模型通常假定变量间的回归函数形式是已知的,只需要对其未知参数进行估计.然而,当解释变量与响应变量之间的具体依存关系不易判定时,参数回归模型无法有效地对数据进行拟合,而非参数回归模型能够弥补该缺陷.非参数回归模型中响应变量与解释变量之间的关系不采用预先确定的形式,而是通过从数据中得到的信息进行构造,因而非参数回归模型具有更强的适应性.在过去的几十年里,非参数回归模型在社会学、医学、生物学、心理学和教育学等领域都有广泛的应用,但关于复杂环境下非参数模型的研究还有待完善.本文主要研究了在不同环境下非参数模型的稳健有效估计、带宽选择及其应用问题,包括基于混合变量下非参数模型的稳健有效估计、基于含有未知跳点数据下非参数模型的稳健有效估计、连接函数带有跳点的单指标模型的稳健有效估计、非参数模型中贝叶斯带宽选择的核估计方法.主要内容如下:第一章着重介绍非参数模型的研究背景、研究意义、研究现状和存在的问题.此外,大致陈述了本文的主要工作,并阐释了本文的主要创新点.第二章研究基于混合变量下非参数模型的稳健有效估计.考虑模型中含有连续与分类变量的情形,对非参数模型提出一种稳健有效估计方法.在给定的条件下,建立了估计量的渐近性质,并运用数值模拟评价了它的有限样本表现.最后通过一个实例分析验证了该方法的有效性.第三章研究基于含有未知跳点数据下非参数模型的稳健有效估计.在实际应用中,直接利用观测数据进行拟合可能造成一定的估计误差,归因于回归函数在某些未知位置存在跳点.因此,如何在含有未知跳点数据下对非参数模型提出较稳健的非参数估计显得非常重要.本章首先基于单边核函数的性质,对含有未知跳点的非参数模型提出一种局部线性众数保跳估计方法.其次,由于局部线性估计量存在巨大的计算量,基于B样条提出一个稳健跳点检测方法.进一步,考虑了其他已有的估计方法来体现所提方法的优越性.蒙特卡洛模拟评价了所提方法的有限样本表现,实例分析说明了所提方法的有效性和可行性.第四章讨论了连接函数带有跳点的单指标模型的稳健有效估计.基于单边核函数的性质,提出了一个不连续单指标模型的稳健有效估计方法.该方法可以克服维数灾难的问题,并且在含有异常点或重尾分布时,所提方法具有稳健性.在一定的假设条件下,建立了所提估计量的相合性和渐近正态性.仿真模拟评价了这些估计量的有限样本性质,实例分析说明了所提方法的有效性.第五章讨论了非参数模型中贝叶斯带宽选择的核估计方法.利用误差项的分布信息,提出了非参数模型的贝叶斯带宽选择方法.所提方法分别给出了误差分布信息已知与未知情形下的带宽后验估计量,并建立了其大样本性质.数值模拟和实际数据分析评价了估计量的有限样本表现.
赵华东[9](2017)在《回归样条在面板计数数据中的应用》文中研究指明本文的主要目的是讨论回归样条在面板计数数据中的应用:(1)处理面板计数数据中协变量的非参数效应并给出相应的假设检验.(2)处理变时间系数模型在面板计数数据中的应用,并讨论估计的理论性质.为了处理面板计数数据中可能存在的非线性或具体形式未知的协变量效应.我们采用回归B样条来估计回归函数和基准均值函数,通过伪似然函数和似然函数得到的估计都具有很好的大样本性质.在一些容易满足的假设条件下,我们证明了基于B样条的非参估计具有相合性,并且得到了估计的收敛速率,在一定的条件下,收敛速率达到了非参样条估计中的最优速率.另外,我们还建立了基于B样条估计的光滑函数的渐近正态性,并讨论了应用自主抽样法计算非参估计误差的有效性.基于已建立的渐近理论,构造了基于B样条估计的统计量,并做了假设检验.通过数据模拟检验了有限样本的理论性质.最后我们将提出的方法应用于儿童哮喘病的研究中,检验白细胞介素-5在儿童哮喘病的研究中是否具有非线性的效应.另外,在儿童哮喘病的研究中,我们怀疑白细胞介素-5的效应与时间有关系.怎样在面板计数数据中拟合变时间系数的模型也是我们感兴趣的事情,尤其是对于儿童哮喘研究的风险因素的考察.因此我们在面板计数数据中提出了变时间系数模型,并基于传统面板计数数据模型的基础,加入了基准风险函数的B样条估计和变时间系数效应的B样条估计.我们采用极大(伪)似然方法来拟合提出的模型,并给出了基于样条的非参估计的大样本性质,数据模拟用来评价模型的有限样本性质.最后我们还通过儿童哮喘研究的数据进一步解释我们提出的模型,并且分析了白细胞介素-5的变时间功效对儿童哮喘的影响.
邓绍坚[10](2017)在《两类相依样本下密度函数估计的相合性》文中提出由于宽象限相依(WOD)是一类包括扩展负相依(END)、负相依(ND)、负相关(NA)在内更普遍的相依随机变量序列,并且广泛地应用于风险分析、多元分析、可靠性理论等多个领域.故将独立或者其它相依序列的非参数统计大样本性质推广到WOD、END情形下是非常重要的.本文主要讨论了WOD、END随机变量样本序列未知密度函数的最近邻密度估计与核密度估计的一些大样本性质,如强相合性、一致强相合性、强收敛速度,同时,也讨论了失效率函数的强收敛速度.推广了独立和其它相依随机变量样本序列下相应的密度函数估计量的大样本性质.全文共分四章.第一章:概述未知密度函数估计问题的研究背景及方法,随机变量序列WOD、END的国内外研究现状并给出了本文的主要研究结果.第二章:由END随机变量样本序列的Bernstein不等式、Rosenthal不等式,在.适当的前提下得到了END随机变量样本序列密度函数递归核估计量的强相合性及r阶矩相合性.第三章:由WOD随机变量样本序列的Exponential不等式,在适当的前提下得到了 WOD随机变量样本序列密度函数一般核估计量的一致强相合性、均方相合性及强收敛速度,同时,作为应用也讨论了失效率函数的强收敛速度.第四章:由WOD随机变量样本序列的Bernstein不等式,在适当的假设前提下得到了 WOD随机变量样本序列未知密度函数最近邻密度估计的一致强相合收敛速度.
二、一类密度估计的r阶平均相合性(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一类密度估计的r阶平均相合性(论文提纲范文)
(1)复杂数据下部分线性变系数模型的变量选择(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 部分线性变系数模型研究现状 |
1.3 复杂数据研究现状 |
1.3.1 纵向数据 |
1.3.2 缺失数据 |
1.3.3 测量误差数据 |
1.4 变量选择研究现状 |
1.5 本文研究内容及结构 |
2 预备知识 |
2.1 部分线性变系数模型 |
2.2 B样条估计方法 |
2.3 二次推断函数方法 |
2.4 变量选择方法 |
3 因变量缺失下部分线性变系数测量误差模型的变量选择 |
3.1 估计方法与主要结果 |
3.1.1 完全数据下估计 |
3.1.2 借补方法下估计 |
3.1.3 渐近性质 |
3.1.4 算法研究 |
3.2 数值模拟 |
3.3 本章小结 |
4 纵向数据下部分线性变系数测量误差模型的变量选择 |
4.1 估计方法与主要结果 |
4.1.1 估计方法 |
4.1.2 渐近性质 |
4.1.3 算法研究 |
4.2 数值模拟 |
4.2.1 实验一 |
4.2.2 实验二 |
4.3 实例分析 |
4.4 本章小结 |
5 总结与展望 |
5.1 主要研究结果 |
5.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间主要研究成果 |
(2)条件非参数独立筛选及在基因数据中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 文献综述 |
1.2.1 基因关联分析 |
1.2.2 变量筛选方法 |
1.3 主要研究内容和创新点 |
1.3.1 主要研究内容 |
1.3.2 本文创新点 |
1.3.3 文章结构 |
第二章 条件非参数独立筛选及其在不确定基因型数据的应用 |
2.1 导论 |
2.2 可加模型 |
2.3 条件非参数独立筛选 |
2.4 主要结论 |
2.5 引入不确定基因型的基因筛选 |
第三章 定理证明 |
3.1 引理及证明 |
3.2 主要结论证明 |
第四章 模拟分析 |
4.1 CNIS筛选效果模拟 |
4.1.1 最小模型尺寸的比较 |
4.1.2 模型筛选比较 |
4.2 将CNIS应用到基因型不确定型数据 |
第五章 结论与展望 |
参考文献 |
致谢 |
(3)若干重要数据类型的降维方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 充分降维方法介绍 |
1.1.1 不同类型数据下的充分降维 |
1.1.2 不同假设条件下的充分降维 |
1.1.3 稀疏充分降维 |
1.2 变量选择方法介绍 |
1.3 本文的研究内容和结构 |
第2章 在线数据下的充分降维方法 |
2.1 引言 |
2.2 在线稀疏切片逆回归 |
2.2.1 人工响应变量(?)的更新 |
2.2.2 在线稀疏切片逆回归的详细算法 |
2.3 估计量的收敛性质 |
2.4 模拟研究 |
2.5 实证分析 |
2.6 本章小节 |
2.7 本章附录 |
第3章 异方差数据下的稀疏充分降维 |
3.1 引言 |
3.2 高维数据的稀疏主分位数回归 |
3.2.1 稀疏主分位数回归 |
3.2.2 高维主分位数回归 |
3.3 估计量的相合性 |
3.4 模拟研究 |
3.5 实证分析 |
3.6 本章小节 |
3.7 本章附录 |
第4章 基于分位数距离协方差的充分降维方法 |
4.1 引言 |
4.2 距离协方差 |
4.3 异方差数据下的基于分位数距离协方差的充分降维方法 |
4.4 模拟研究 |
4.5 本章小结 |
第5章 基于广义半参理论的非线性充分降维方法 |
5.1 引言 |
5.2 广义半参数理论下的非线性充分降维 |
5.2.1 广义半参数理论下非线性充分降维方法的估计方程 |
5.2.2 基于广义半参数理论的核切片逆回归方法 |
5.2.3 理论性质和算法 |
5.3 模拟研究 |
5.4 实证分析 |
5.5 本章小节 |
5.6 本章附录 |
第6章 高维部分线性模型的变量选择和估计 |
6.1 引言 |
6.2 部分线性模型中的双惩罚估计 |
6.3 主要假设和理论研究 |
6.3.1 主要假设 |
6.3.2 渐近性质 |
6.4 模拟研究 |
6.4.1 示例1: 非参数部分为线性函数和高斯函数的组合 |
6.4.2 示例2: 非参数部分为正弦函数和高斯函数的组合 |
6.5 实证分析 |
6.5.1 实例1: 营养素研究 |
6.5.2 示例2: BRCA1数据集上的经验分析 |
6.6 本章小节 |
6.7 本章附录 |
6.8 本章附图附表 |
6.8.1 模拟研究附图附表 |
6.8.2 实证分析附图附表 |
第7章 未来工作展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(4)相依误差下若干统计模型中两类估计量的渐近性质(论文提纲范文)
摘要 |
Abstract |
符号说明 |
第一章 绪论 |
§1.1 研究背景 |
§1.2 相关概念 |
§1.3 模型简介 |
§1.4 本文框架结构 |
第二章 预备知识 |
§2.1 若干收敛性的定义 |
§2.2 相关引理 |
第三章 END序列加权和的完全f-矩收敛性及其在EV模型中的应用 |
§3.1 END序列加权和的完全f-矩收敛性 |
§3.2 应用 |
§3.3 数值模拟 |
§3.4 小结 |
第四章 φ混合误差下半参数回归模型中估计量的矩相合性 |
§4.1 模型假设 |
§4.2 主要结果及其证明 |
§4.3 数值模拟 |
§4.4 小结 |
第五章 α混合误差下非线性回归模型中估计量的矩相合性与渐近正态性 |
§5.1 模型假设 |
§5.2 主要结果及其证明 |
§5.3 数值模拟 |
§5.4 小结 |
第六章 结束语 |
参考文献 |
致谢 |
硕士期间科研情况 |
(5)相依误差下几类统计模型的大样本性质(论文提纲范文)
摘要 |
ABSTRACT |
符号说明 |
第一章 绪论 |
§1.1 研究背景 |
§1.2 本文结构 |
第二章 m-END误差下多元线性模型中估计量的相合性 |
§2.1 m-END随机变量的收敛性 |
§2.2 m-END误差下多元线性模型中估计量的相合性 |
§2.3 数值分析 |
第三章 非参数回归模型中估计量的渐近性质 |
§3.1 模型(1.2)中P-C估计的相合性 |
§3.1.1 假设条件及主要结果 |
§3.1.2 主要结果的证明 |
§3.1.3 P-C估计量的数值分析 |
§3.2 模型(1.3)中加权估计的渐近正态性及逼近速度 |
§3.2.1 假设条件及主要结果 |
§3.2.2 主要结果的证明 |
§3.2.3 加权估计量渐近正态性的数值分析 |
§3.3 模型(1.3)中加权估计的完全相合性 |
§3.3.1 主要结果及数值分析 |
§3.3.2 主要结果的证明 |
第四章 部分线性回归模型中估计量的渐近性质 |
§4.1 部分线性回归模型中估计量的Berry-Esseen界 |
§4.1.1 假设条件及主要结果 |
§4.1.2 主要结果的证明 |
§4.1.3 数值分析 |
§4.2 部分线性回归模型中估计量的相合性 |
§4.2.1 假设条件及主要结果 |
§4.2.2 主要结果的证明 |
§4.2.3 数值分析 |
第五章 WOD误差下EV回归模型中估计量的相合性 |
§5.1 主要结果 |
§5.2 主要结果的证明 |
§5.3 数值分析 |
第六章 WOD误差下异方差部分线性EV回归模型中估计量的相合性 |
§6.1 估计量的构造及主要结果 |
§6.2 主要结果的证明 |
§6.3 数值分析 |
第七章 结束语 |
参考文献 |
致谢 |
攻读博士学位期间学术成果及获奖情况 |
(6)网络数据的判别分析和因子模型(论文提纲范文)
摘要 |
英文摘要 |
第一章 绪论 |
1.1 研究背景 |
1.2 网络的表示和特征 |
1.3 网络数据建模的发展及现状 |
1.3.1 离散型网络数据建模 |
1.3.2 连续型网络数据建模 |
1.4 本文研究的问题及主要结果 |
第二章 网络线性判别分析 |
2.1 引言 |
2.2 预备知识 |
2.3 网络线性判别分析 |
2.3.1 模型和记号 |
2.3.2 网络线性判别分析 |
2.3.3 稀疏NLDA |
2.4 数值研究 |
2.4.1 模拟实验 |
2.4.2 评价测度和模拟结果 |
2.4.3 新浪微博数据集 |
2.5 理论证明 |
2.5.1 NLDA模型MLEs的推导 |
2.5.2 定理2.3.1的证明 |
2.5.3 定理2.3.2的证明 |
2.5.4 定理2.3.3的证明 |
第三章 基于带交互项对称双向因子模型的连续网络建模 |
3.1 引言 |
3.2 预备知识 |
3.3 带交互项对称双向因子模型 |
3.4 极大似然估计及其理论性质 |
3.5 数值研究 |
3.5.1 模拟实验 |
3.5.2 评价测度和模拟结果 |
3.6 理论证明 |
3.6.1 定理3.3.1的证明 |
3.6.2 定理3.4.1的证明 |
3.6.3 定理3.4.2的证明 |
3.6.4 EM算法推导 |
总结 |
参考文献 |
致谢 |
在学期间(待)公开发表论文及着作情况 |
(7)NSD随机序列下非参数估计的相合性(论文提纲范文)
摘要 |
abstract |
第1章 引言 |
1.1 选题背景与研究意义 |
1.2 国内外研究现状及分析 |
1.3 预备工作 |
1.3.1 非参数密度估计 |
1.3.2 相合性 |
1.3.3 定义 |
1.3.4 重要的不等式和引理 |
1.4 本文的主要研究成果 |
1.5 主要工作和创新点 |
第2章 NSD样本下密度核估计的相合性 |
2.1 预备知识 |
2.2 引理 |
2.3 密度核估计的逐点相合性、一致相合性及r阶矩相合性 |
2.4 本章总结 |
第3章 NSD样本下非参数回归函数估计的相合性 |
3.1 预备知识 |
3.2 不等式及引理 |
3.3 非参数回归函数估计的强相合性 |
3.4 数值模拟 |
3.5 本章总结 |
第4章 NSD样本最近邻密度估计的相合性 |
4.1 预备知识 |
4.2 最近邻密度估计的强、弱相合性和一致强相合性 |
4.3 本章总结 |
第5章 结论与展望 |
5.1 结论 |
5.2 展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(8)非参数模型的稳健有效估计及其应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 研究现状和存在的问题 |
1.2.1 非参数模型的研究现状 |
1.2.2 单指标模型的研究现状 |
1.2.3 带宽选择的研究现状 |
1.3 本文的主要工作 |
1.3.1 主要研究内容 |
1.3.2 主要创新点 |
第二章 含有分类协变量的非参数模型的稳健有效估计及其应用 |
2.1 引言 |
2.2 回归函数的估计方法 |
2.2.1 局部线性众数完全光滑估计 |
2.2.2 EM算法 |
2.3 渐近性质与估计步骤 |
2.3.1 估计量的渐近性质 |
2.3.2 带宽选择 |
2.3.3 估计步骤 |
2.4 数值模拟和实例分析 |
2.4.1 数值模拟 |
2.4.2 实例分析 |
2.5 假设条件和定理的证明 |
2.6 本章小结 |
第三章 含有未知跳点的非参数模型的稳健有效估计及其应用 |
3.1 引言 |
3.2 回归函数的估计方法 |
3.2.1 分段局部众数估计量 |
3.2.2 分段B样条跳点检测方法 |
3.3 相合性 |
3.4 数值模拟和实例分析 |
3.4.1 数值模拟 |
3.4.2 实例分析 |
3.5 假设条件和定理的证明 |
3.6 本章小结 |
第四章 连接函数带未知跳点的单指标模型的稳健有效估计及其应用 |
4.1 引言 |
4.2 半参数局部众数保跳估计方法 |
4.2.1 半参数局部众数估计 |
4.2.2 保跳技术 |
4.2.3 半参数局部众数保跳估计 |
4.2.4 计算过程 |
4.2.5 比较准则 |
4.3 渐近性质 |
4.3.1 估计量的相合性 |
4.3.2 最优带宽的选择 |
4.4 数值模拟和实例分析 |
4.4.1 数值模拟 |
4.4.2 实例分析 |
4.5 假设条件和定理的证明 |
4.6 本章小结 |
第五章 基于贝叶斯带宽选择的核估计方法及其应用 |
5.1 引言 |
5.2 贝叶斯带宽选择方法 |
5.2.1 误差分布已知的贝叶斯带宽选择方法 |
5.2.2 误差分布未知的贝叶斯带宽选择方法 |
5.2.3 马尔可夫链蒙特卡罗抽样算法 |
5.2.4 非参数设定检验 |
5.3 贝叶斯带宽选择的渐近性质 |
5.4 数值模拟和实例分析 |
5.4.1 数值模拟 |
5.4.2 实例分析 |
5.5 假设条件和定理的证明 |
5.6 本章小结 |
结论 |
致谢 |
参考文献 |
附录 |
(9)回归样条在面板计数数据中的应用(论文提纲范文)
摘要 |
ABSTRACT |
主要符号对照表 |
第一章 引言 |
§1.1 面板计数数据的简介 |
§1.2 文献综述 |
§1.3 本文的主要工作 |
第二章 预备知识 |
§2.1 经验过程基本知识及引理 |
§2.2 B样条简介及引理 |
§2.3 高斯正交法 |
第三章 面板计数数据中的非参回归模型 |
§3.1 引言 |
§3.2 模型介绍和B-样条估计 |
§3.2.1 基本概念和模型 |
§3.2.2 B-样条估计 |
§3.3 渐近结果 |
§3.3.1 假设条件 |
§3.3.2 非参估计的大样本性质 |
§3.3.3 非参估计检验统计量的构造 |
§3.4 数据模拟 |
§3.4.1 数据的产生 |
§3.4.2 非参数模型下的数据模拟 |
§3.4.3 半参数模型下的数据模拟 |
§3.5 实际数据分析 |
§3.6 本章附录 |
§3.6.1 定理3.3.1中极大伪似然估计相合性的证明 |
§3.6.2 定理3.3.2极大伪似然估计收敛速度的性质证明 |
§3.6.3 定理3.3.3极大伪似然估计渐近正态的性质证明 |
§3.6.4 伪似然估计自助抽样法的有效性 |
§3.6.5 定理3.3.1中极大似然估计相合性的证明 |
§3.6.6 定理3.3.2中极大似然估计收敛速率的证明 |
§3.6.7 定理3.3.3中极大似然估计渐近正态性的证明 |
§3.6.8 似然估计自助抽样法的有效性 |
§3.7 本章小结 |
第四章 面板计数数据中的变时间系数模型 |
§4.1 引言 |
§4.2 模型的精确化 |
§4.3 估计回归系数和基准风险函数 |
§4.4 渐近性和推断 |
§4.5 数据模拟 |
§4.6 实际数据的应用 |
§4.7 本章附录 |
§4.7.1 定理4.4.1中极大伪似然估计相合性的证明 |
§4.7.2 定理4.4.2中极大伪似然估计收敛速率的证明 |
§4.7.3 定理4.4.3中极大伪似然估计渐近性的证明 |
§4.7.4 定理4.4.1中极大似然估计相合性的证明 |
§4.7.5 定理4.4.2中极大似然估计收敛速率的证明 |
§4.7.6 定理4.4.3中极大似然估计渐近性的证明 |
§4.8 本章小结 |
第五章 结论 |
参考文献 |
致谢 |
在学期间的研究成果及发表的论文 |
(10)两类相依样本下密度函数估计的相合性(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 预备知识 |
1.3 本文的主要结果 |
第二章 END样本序列下密度函数递归核估计的强相合性及r阶矩相合性 |
2.1 引言 |
2.2 引理 |
2.3 密度函数递归核估计的强相合性及r阶矩相合性 |
2.4 本章小结 |
第三章 WOD样本序列下密度函数一般核估计的相合性及强收敛速度 |
3.1 引言 |
3.2 引理 |
3.3 密度函数一般核估计的一致强相合性及均方相合性 |
3.4 密度函数一般核估计的强收敛速度 |
3.5 本章小结 |
第四章 WOD样本序列下最近邻密度估计的一致强相合收敛速度 |
4.1 引言 |
4.2 引理 |
4.3 最近邻密度估计的一致强相合收敛速度 |
4.4 本章小结 |
结论与展望 |
参考文献 |
攻读硕士期间主要研究成果 |
致谢 |
四、一类密度估计的r阶平均相合性(论文参考文献)
- [1]复杂数据下部分线性变系数模型的变量选择[D]. 王鹏鹏. 西安理工大学, 2021(01)
- [2]条件非参数独立筛选及在基因数据中的应用[D]. 徐萍. 广西师范大学, 2021(10)
- [3]若干重要数据类型的降维方法研究[D]. 程浩洋. 中国科学技术大学, 2021(09)
- [4]相依误差下若干统计模型中两类估计量的渐近性质[D]. 王燕. 安徽大学, 2020(10)
- [5]相依误差下几类统计模型的大样本性质[D]. 吴燚. 安徽大学, 2020(08)
- [6]网络数据的判别分析和因子模型[D]. 蔡巍. 东北师范大学, 2019(04)
- [7]NSD随机序列下非参数估计的相合性[D]. 聂彩玲. 南昌大学, 2019(02)
- [8]非参数模型的稳健有效估计及其应用研究[D]. 韩忠成. 东南大学, 2019(05)
- [9]回归样条在面板计数数据中的应用[D]. 赵华东. 华东师范大学, 2017(04)
- [10]两类相依样本下密度函数估计的相合性[D]. 邓绍坚. 广西师范学院, 2017(03)