🔄 ChatGPT代码库更新:
英语语言/翻译文件、图像生成样式图像等变更引入新功能:DALL·E 3 图像风格、ChatGPT启动新聊天创意ChatGPT数据分析升级到V2版本知识库更新至2023年12月
🔗 https://x.com/xiaohuggg/status/1761767133019865336?s=20
🔍 Sora功能体验:
在OpenAI技术报告中提到通过关键词生成视频:人物、着装、天气、地理位置提供不同组合生成视频的简易版本
🔗 https://openai.com/research/video-generation-models-as-world-simulators
🖼️ StabilityAI图像控制API:
功能包括:搜索替换对象、图像编辑修复、增强图像、生成视频、选择性图像修改
🔗 https://platform.stability.ai/docs/api-reference#tag/v2alphageneration/paths/~1v2alpha~1generation~1stable-image~1inpaint/post
🔗 https://x.com/xiaohuggg/status/1761632850250735647?s=20
👁️ Depth Anything技术:
香港大学和TikTok开发的单目深度估计技术预测图像中每个点的深度信息超过6200万张图像训练,性能超越顶尖模型
🔗 https://depth-anything.github.io
🔗 https://arxiv.org/abs/2401.10891
🔗 https://x.com/xiaohuggg/status/1761605006535602516?s=20
🏃 Move AI推出Move API:
从2D视频生成3D运动数据支持多种3D文件格式导出为AR应用、游戏开发等提供高质量3D运动数据
🔗 https://move.ai/api
🔗 https://x.com/xiaohuggg/status/1761590288576061573?s=20
📱 AllenTom/diffusion-client项目:
为Android用户提供与Stable-Diffusion-WebuUI服务交互的客户端支持图像生成、编辑、修复、换脸等包含文本到图像、图像到图像、图像修复等功能
🔗 https://github.com/AllenTom/diffusion-client?tab=readme-ov-file
🔗 https://x.com/xiaohuggg/status/1761371355583516842?s=20
评论(0)