1⃣️
🔄 ChatGPT代码库更新:

英语语言/翻译文件、图像生成样式图像等变更引入新功能:DALL·E 3 图像风格、ChatGPT启动新聊天创意ChatGPT数据分析升级到V2版本知识库更新至2023年12月
🔗 https://x.com/xiaohuggg/status/1761767133019865336?s=20

 
2⃣️
🔍 Sora功能体验:

在OpenAI技术报告中提到通过关键词生成视频:人物、着装、天气、地理位置提供不同组合生成视频的简易版本
🔗 https://openai.com/research/video-generation-models-as-world-simulators

3⃣️
🖼️ StabilityAI图像控制API:

功能包括:搜索替换对象、图像编辑修复、增强图像、生成视频、选择性图像修改
🔗 https://platform.stability.ai/docs/api-reference#tag/v2alphageneration/paths/~1v2alpha~1generation~1stable-image~1inpaint/post
🔗 https://x.com/xiaohuggg/status/1761632850250735647?s=20

 
4⃣️
👁️ Depth Anything技术:

香港大学和TikTok开发的单目深度估计技术预测图像中每个点的深度信息超过6200万张图像训练,性能超越顶尖模型
🔗 https://depth-anything.github.io
🔗 https://arxiv.org/abs/2401.10891
🔗 https://x.com/xiaohuggg/status/1761605006535602516?s=20

 
5⃣️
🏃 Move AI推出Move API:

从2D视频生成3D运动数据支持多种3D文件格式导出为AR应用、游戏开发等提供高质量3D运动数据
🔗 https://move.ai/api
🔗 https://x.com/xiaohuggg/status/1761590288576061573?s=20

 
6⃣️
📱 AllenTom/diffusion-client项目:

为Android用户提供与Stable-Diffusion-WebuUI服务交互的客户端支持图像生成、编辑、修复、换脸等包含文本到图像、图像到图像、图像修复等功能
🔗 https://github.com/AllenTom/diffusion-client?tab=readme-ov-file
🔗 https://x.com/xiaohuggg/status/1761371355583516842?s=20

 
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。