3D言语模型的新打破 解锁虚拟事实中的幻觉疑问
随着人工智能技术的飞速开展,3D言语模型,3D,LLMs,已成为钻研的热点,它们无了解和生成言语指令方面展现出了渺小的后劲,这些模型不只能够处置文本消息,还能了解和操作三维空间中的物体,这关于开展能够与物理环球互动的智能系统至关关键,3D言......
视觉成果超赞!轻易画个草图就能生成3D交互游戏场景!腾讯XR出品
文章链接,https,arxiv.org,pdf,2408.04567名目地址,https,xrvisionlabs.github.io,Sketch2Scene,亮点直击3D内容生成是许多计算机图形运行的外围,包括视频游戏、电影制造、虚构......
ACM MM24
文章链接,https,arxiv.org,pdf,2409.07452Github链接,https,github.com,yanghb22,fdu,Hi3D,Official总结速览处置的疑问Hi3D框架旨在处置从高分辨率图像生成3D模型时......
开源视频模型SV4D 一键创立8角度灵活3D视频
Stability.ai开源了翻新视频模型StableVideo4D,简称,SV4D,,可将一个视频轻松创立8个角度的灵活3D视频,经常使用方法也十分便捷,用户只有要上行视频而后选用3D相机姿态,经过大概40秒左右的推理就能成功视频创立,相......
文本生成高品质3D模型 仅需1分钟
环球社交、科技巨头Meta颁布了全新文生3D模型——Meta3D,Gen,用户经过Meta3D,Gen仅需1分钟就能生成人物、生物、道具、服饰、工业设计等不同类型的高品质3D模型,Meta3D,Gen不只生成的内容是高分辨率的纹理和材质贴图......
一分钟搞定恣意数量视图到3D场景重建 谷歌重磅颁布CAT3D
论文链接,https,arxiv.org,pdf,2405.10314名目链接,https,cat3d.github.io,3D重建的提高使得高品质的3D捕捉成为或者,但须要用户搜集数百到数千张图像来创立一个3D场景,本文提出了CAT3D,......
谷歌新作让人难绷 2D头像生成3D虚构人开视频会
开视频远程会议的时刻,很多人都不青睐关上摄像头,即使开了,在界面上大家也都被框在不同的窗口里,只管这种方式操作起来很繁难,但总是不足点临场感,最近,谷歌提出了一项钻研旨在处置这个疑问,这个名叫ChatDirector的技术可以经常使用静态的......
上海AI 港大& 自定义3D编辑和资发生成 3D版裁缝开源来袭!Tailor3D
文章链接,https,arxiv.org,pdf,2407.06191github链接,https,tailor3d,2024.github.io,Huggingface,https,huggingface.co,spaces,alexzy......
DreamTech联结南大和牛津颁布最强3D内容生成大模型
文章链接,https,arxiv.org,pdf,2405.14832github链接,https,nju,3dv.github.io,projects,Direct3D,从文本和图像生成高品质的3D资产不时是一项应战,关键是由于不足能够捕......
上交港中文新框架逾越Instant3D 5秒成功3D生成 真香分解数据集已开源
经常使用大模型分解的数据,就能清楚优化3D生成才干,来自上海交大、香港中文大学等团队还真做到了,他们推出Bootstrap3D框架,结合微调的具有3D感知才干的多模态大模型,这个框架能够智能生成恣意数量的高品质的多视角图片数据,助力多视图分......