百度申请基于大模型的三维场景图像生成专利,生成目标场景的三维场景图像
金融界2025年4月10日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“基于大模型的三维场景图像生成方法、装置及电子设备”的专利,公开号 CN 119784940 A,申请日期为2024年12月。
专利摘要显示,本申请公开了基于大模型的三维场景图像生成方法、装置及电子设备,涉及计算机技术领域,尤其涉及大模型、深度学习、计算机视觉等领域。具体实现方案为:获取目标场景中的至少一个对象的文本描述信息及对象的二维位置信息;根据文本描述信息和二维位置信息,生成参考图像;对参考图像进行实例分割,获取对象的实例图像;基于实例图像对对象进行三维重建,以获取对象的第一三维图像;根据第一三维图像,生成目标场景的三维场景图像。
天眼查资料显示,北京百度网讯科技有限公司,成立于2001年,位于北京市,是一家以从事互联网和相关服务为主的企业。企业注册资本1342128万人民币,实缴资本1342128万人民币。通过天眼查大数据分析,北京百度网讯科技有限公司共对外投资了75家企业,参与招投标项目2855次,财产线索方面有商标信息982条,专利信息5000条,此外企业还拥有行政许可57个。
本文源自:金融界
作者:情报员