基于置信度融合的多视角深度神经网络结构及估计方法解析,对唯品会营销推广的建议
栏目:网络营销 发布时间:2025-02-02
本发明的专利技术涉及基于基于自信的融合的神经网络结构和估算方法的多个广播深度。为了应对多个观察深度估计任务中置信度的问题和较低的信心,基于置信度的融合基于基 ... 基于置信度融合的多视角深度神经网络结构及估计方法解析
    本发明的专利技术涉及基于基于自信的融合的神经网络结构和估算方法的多个广播深度。为了应对多个观察深度估计任务中置信度的问题和较低的信心,基于置信度的融合基于基于置信度的融合。多 - 观点深度估计方法和网络。包括4个尺度的特征提取网络和四个级别的深度采样模块。充分利用训练优势在多回合训练过程中,提出相邻领域的平均合并策略,并结合CL组合损耗函数,从而显着提高了目标视角深度估计的完整性和准确性。

    所有详细的技术信息下载

    [技术实施步骤摘要]

    该专利技术属于机器学习。计算机视觉领域中的三维重建技术涉及基于基于自信的多种镜面深度的神经网络结构和估算方法。

    技术简介

    1。近年来,随着机器学习和人工智能的快速发展,与计算机视觉相关的相关技术取得了重大结果。  3D重建技术是最具代表性的技术。据估计,基于视觉三维重建技术,多角度的深度估计是最关键的技术点。由于方便的数据获取和低成本的优势,多广场深度估计技术被广泛用于智能驾驶,虚拟现实,古老的建筑恢复和其他场景,成为人工智能感知和分析现实世界的关键方法之一。

    2。从所采用的方法中,可以将多个观点深度估计技术分为几何模型和学习模型。基于几何模型,参考角度的深度图是通过随机初始化,光学一致性计算和迭代通信优化获得的。它的解释性更高,但是很难处理重复的纹理,反射区域和低纹理区域。学习模型基于数据集的构建,设计和训练神经网络模型,然后基于从培训获得的培训的参考角度图的深度图是基于培训。由于深度神经网络可以适应更多的图像领域和更复杂的纹理关系,因此基于学习的学习模型可以显着提高深度估计图的准确性和完整性。

    3。尽管学习模型具有重要的优势,但从深入估计的角度来看,仍然存在一些困难的挑战。首先,实际的多视图深度估计数据集通常是从单个时间间隔收集的单个摄像头。由于对象移动以及灯光和阴影变换等问题,数据集本身会有更多的噪声。该模型是培训的培训。在后来,它在各种近似解决方案之间振荡。其次,基于分类损失作为主流的多尺度多范围的多镜深度估计模型,作为主流的性能提高了性能。在视角上,深度置信度的现象均匀地划分为角度的透视。原始估计的准确的深光面积对规律性缺乏信心。

    技术实施

    1。要解决的技术问题

    2。为了避免现有技术的缺点,该专利技术提出了一种基于多个保密性深度的神经网络结构和估算方法,以解决学习多尺度和多尺度和多种性深度深度估计方法的存在基于学习。诸如置信度振荡和缺乏信心之类的问题已显着提高了多方面深度估计的完整性和准确性。

    3。技术解决方案

    4。基于自信集成的多个观点深度估计方法,其特征在于以下步骤:

    5。步骤1:在同一场景中使n位同一场景的n观看角度,并从n视角{i1,i2,...,in}中获取RGB图像。参数和整个场景的稀疏点云,稀疏点云包含k三维点;

    6。选择一个RGB图像作为参考图。计算参考图和其他透视图像之间的总体信任值GJ。与的可信值相比,将参考图比较了GJ,K Plus线束:

    7。

    8。GJ是JJ图像和参考图之间的总体信任值。

    9。根据从大到小的GJ值选择M图像作为源图;

    10。步骤2:参考图和M源图用于提取具有4个尺度特征的4个尺度特征,以获得参考图的深度特征集和M源图F = {fr,f1,... FM};

    11。每个深度功能集都包含4个尺度的深度特征:

    12。

    13。不同规模的深度特征的大小:

    14。

    15。其中,s表示量表数,CS表示当前量表的通道数。