小互日报-1 月 22 日-aihublet

1⃣️

📖 “ 大新闻！语言克隆初创公司 #ElevenLabs 刚刚完成了8000万美元的B轮融资，公司估值飙升至10亿美元以上！达到独角兽级别！

他们的工具能创建克隆逼真的声音，并可调整语调、情感、节奏等声音特征。
公司计划在年底前将其团队从40人扩展到100人。

本轮融资由包括Andreessen Horowitz、前GitHub CEO Nat Friedman和企业家Daniel Gross在内的知名投资者共同领投。

本轮融资将ElevenLabs的总融资额提升到1.01亿美元，公司估值超过10亿美元。
来源：https:// t.co/3KUtR2vF6A

2⃣️

又一款人工智能音乐生成器：Beatoven AI

Beatoven用于视频、播客和游戏创作者创建配合其内容情绪的背景音乐。它结合了先进的AI技术，提供了一个简单、直观的界面，使用文本描述即可生成音乐。

同时它配有一个音乐编辑器，可以从16种丰富的情绪选项中选择适合剪辑的情绪进行在线编辑。主要功能和特点：

AI音乐生成：使用人工智能技术创作版权免费的背景音乐，适用于视频、播客和游戏等多种媒体内容。简易操作流程：用户选择了音乐的风格、类型和情绪之后，只需点击一个名为”组成”的按钮，人工智能系统就会自动根据这些设定创作出一条音乐轨道。这个过程不需要用户进行复杂的音乐编排或深入的音乐知识，AI会根据用户的选择生成一段完整的背景音乐。用户友好的界面：提供了一个无代码平台，易于设置和使用，适合所有技能水平的开发者。音乐定制化：提供无限定制选项，包括音乐长度、风格、情绪和乐器，以创造符合特定主题和情绪的音乐轨道。
在线体验：https:// beatoven.ai

3️⃣

HeyGen的最新功能演示

可以和AI进行视频聊天，就是你用文字可以和机器人对话，然后机器人有一个具象的形象，它可以通过视频来和你聊天！

视频里的人物、声音和回答都是AI生成的的！

可以理解为文字转视频：TTV

4️⃣

Google研究团队开发了一个名为ASPIRE的新技术，它可以改善大语言模型在做出预测时的准确性和可靠性。

ASPIRE主要特点：

让AI模型先回答问题，然后再自己检查答案是否正确。通过这种自我评估，模型能更准确地区分正确和错误的答案并给出信心分数。无论模型大小，它都能帮助提高准确性。简单来说，ASPIRE帮助这些AI模型更好地判断它们的答案是否正确，并且只在比较有把握的时候给出预测。在ASPIRE的帮助下，模型不仅能给出答案，还能同时提供一个与答案配对的信心分数，即模型对自己答案的自信程度。通过提供信心分数，模型能够表达自己对于答案的不确定性。这种透明度对于用户来说是非常有价值的，尤其是在涉及重要决策的情况下。例如，如果模型对一个医疗相关的问题给出了低信心分数的答案，用户就会知道需要谨慎对待这个答案，并寻求专业人士的意见。

工作原理：两阶段指令调整：用于增强LLM在执行零样本会话式QA任务时的性能。

在第一阶段，LLM接受通用的预训练，这使得它具备处理各种类型的文本和问题的基本能力。

第二阶段是专门的微调阶段，其中模型针对特定类型的问答任务进行训练，如会话式问答。这使得模型能够更好地理解和回答连续的、上下文相关的问题。

检索增强生成（RAG）：用于优化密集检索器，减少部署成本。

RAG是一种结合了信息检索和生成模型的技术。它首先使用一个密集的检索器（例如搜索引擎）从大量数据中检索与问题相关的信息。

然后，模型使用这些检索到的信息来生成更精确、相关的答案。RAG的优势在于它可以减少对大规模训练数据的依赖，同时降低部署模型的成本。

ASPIRE的工作机制： ASPIRE的工作原理主要基于以下几个关键步骤，这些步骤共同帮助提高大型语言模型（LLM）在选择性预测任务中的性能： 1、任务特定调整：对模型进行微调，以适应特定的任务，例如问答。这意味着模型被训练得更好地理解和回应特定类型的查询。

2、答案抽样：在回答问题时，模型不仅生成单一的答案，而是产生多个可能的答案选项。这样做可以覆盖更多可能性，提高找到正确答案的机会。

3、自我评估学习：模型通过分析自己生成的答案集合，学习如何区分哪些答案更可能是正确的。这种自我评估能力使模型能够判断其回答的可靠性。

4、性能评估与选择性回应：当面对实际问题时，模型利用其自我评估能力来判断是否有足够的信心回答。模型使用内置的评估机制来评估它生成的答案的可信度。这时，模型会生成一个信心分数，表明它对自己的答案有多确信。如果模型对答案不够确定，它可能选择不提供答案，以避免给出错误信息。

5、持续优化：ASPIRE框架允许模型不断从新数据和用户互动中学习，进一步优化其预测准确性和自我评估能力。

综上所述，ASPIRE通过结合专门的微调、答案生成、自我评估和性能优化，使得大语言模型在处理复杂和高风险的决策任务时更加可靠和准确。这种方法特别适用于那些需要高度精确答案的应用场景。

ASPIRE实验结果： 1、准确率提升：在诸如CoQA、TriviaQA和SQuAD等问答（QA）数据集上，ASPIRE的实验结果显示，其性能显著优于现有方法。特别是在那些要求高度准确性的任务上，ASPIRE表现出色。例如，在 CoQA 基准上，与基线相比，ASPIRE 将 AUROC 从 51.3% 提高到 80.3%。

2、适用于不同规模的模型：即使是相对较小的语言模型（如OPT-2.7B），在经过ASPIRE调整之后，也能在某些情况下达到或超过更大模型的准确率。这意味着ASPIRE不仅提高了模型的总体性能，还增强了模型在处理特定任务时的灵活性和有效性。

3、自我评估的成功实施：ASPIRE通过引入自我评估机制，有效地提高了模型识别正确和错误答案的能力。这在实验中体现为更高的预测准确率和选择性回应能力。应用案例：使用OPT-2.7B模型来回答TriviaQA数据集中的问题，展示了如何通过选择性预测提高模型的准确性。

在这个示例中，OPT-2.7B模型在回答来自TriviaQA数据集的一个问题时给出了错误的答案。问题是：”哪种维生素有助于调节血液凝固？”而模型的答案是”维生素C”。如果没有选择性预测，大语言模型（LLM）可能会输出错误的答案，这在本例中可能导致用户摄取错误的维生素。

通常情况下，如果没有选择性预测功能，语言模型（比如OPT-2.7B）就会直接给出它认为最可能的答案，不管这个答案是否正确。在这个例子中，就是错误地告诉用户”维生素C有助于调节血液凝固”，这可能会误导用户。

但是，如果使用了选择性预测功能，情况就不一样了。选择性预测不仅会让模型给出一个答案，还会给这个答案一个”选择分数”，这个分数表示模型对自己的答案有多大的信心。如果这个分数很低（比如0.1），这意味着模型对自己的答案不太有信心。

在这种情况下，模型除了给出答案外，还会额外表示”我不知道！”这样的警告。这个警告的目的是告诉用户，模型对这个答案不够确定，用户最好不要完全依赖这个答案，可能需要通过其他来源来验证这个信息。

详细介绍：https:// blog.research.google/2024/01/introducing-aspire-for-selective.html…

5️⃣

第一个能够检测所有主要皮肤癌的AI医疗设备DermaSensor 刚刚获得FDA批准。该设备能检测三种最常见的皮肤癌：黑色素瘤、基底细胞癌和鳞状细胞癌。
在1000多名患者的研究中，DermaSensor在检测224例皮肤癌方面表现出高灵敏度，正确阳性率为96%。
DermaSensor看起来类似于底部有尖头的智能手机，用于非侵入扫描皮肤病变。当尖端接触皮肤时，它会投射不同波长的光，穿透皮肤并与细胞相互作用。DermaSensor的主要功能：

1、检测皮肤癌：能够检测三种最常见的皮肤癌类型：黑色素瘤、基底细胞癌和鳞状细胞癌。
2、非侵入性扫描：通过设备底部的尖端对皮肤病变进行扫描，使用不同波长的光与皮肤细胞相互作用，从而检测癌细胞。
3、AI风险评估：扫描后，设备利用内置的AI模型提供自动风险评估，提示医生“进一步调查”或“监测”。
4、高灵敏度和特异性：根据临床试验，DermaSensor在检测皮肤癌方面显示出高灵敏度和特异性，能够准确地识别皮肤癌并减少不必要的活检。
5、适用于所有皮肤类型：在不同皮肤类型的患者中保持一致的性能，使其成为一个有效的全人群皮肤癌筛查工具。

FDA（美国食品药品监督管理局）临床研究的结果。涵盖了22个研究中心，共有超过1000名患者参与，目的是验证DermaSensor设备的性能。主要发现和结果包括：
1、高灵敏度：在224例皮肤癌病例中，DermaSensor设备的灵敏度为96%。这意味着设备在识别这些癌症病例方面的准确率非常高。
2、高特异性：当设备给出阴性结果（即判断为非癌症）时，有97%的概率确实是良性病变，对所有类型的皮肤癌都是如此。
3、临床实用性研究：在一项涉及108名医生的附加研究中，发现使用DermaSensor设备可以将漏诊皮肤癌的比例减少一半（从18%降至9%）。这表明该设备能够提高医生在评估癌症病变时的准确性和信心。
详细：https:// dermasensor.com

6️⃣

GPT Auth：提供GPTs用户认证功能，确保只有授权用户才能访问你的GPT应用。
还可以针对GPTs应用进行收费，包括订阅、按次使用和一次性购买。这样你就能对自己的GPTs用户进行收费了！同时还能跟踪收集GPTs的使用报告等详细信息，帮助开发者了解用户行为和需求。

主要功能和特点：

安全认证：为GPT应用提供强大的用户认证功能，保护应用免受未授权访问。

详细分析：轻松监控用户与GPT的互动，提供实时查询跟踪和数据报告。

简化支付（即将推出）：轻松接受GPT应用的付款，包括订阅、按次使用和一次性购买。

无代码平台：易于设置，无需编程知识，适用于所有技能水平的开发者。无缝集成：与GPT商店无缝集成，易于设置和使用。

基于角色的访问控制：为用户定义不同级别的访问权限。实时使用跟踪：监控GPT性能并识别改进领域。

灵活的定价选项：根据需求选择最适合的定价模式。

7️⃣

Apple Vision Pro 的模拟真实世界物体构造和物理规律功能演示！

该功能在Apple Vision Pro发布会上演示过！

看来不是噱头！

使用的是@JigSpace公司的3D to CAD技术！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

小互日报-1 月 22 日

评论(0)

提示：请文明发言取消回复

近期文章

近期评论

小互日报-1 月 22 日

相关文章

知识库精选- 12 月 31 日

AI辅助设计训练营：基础入门与初步应用课程+深入实战课程

小互日报-3 月 3 日

NASA Mission Critical Coding: Understanding Risk, Artificial Intelligence, and Improving Software Quality

评论(0)

提示：请文明发言 取消回复

近期文章

近期评论

提示：请文明发言取消回复