1. Chroma获得1800万美元的种子轮融资

快速增长的嵌入式数据库公司Chroma宣布获得1800万美元的种子轮融资。该公司的开源工具旨在为不同的LLM应用程序添加状态和内存,从而减少幻觉并增加事实性。随着不同的LLMOps工具不断融合,这将是一个令人感兴趣的发展趋势。

三大看点:
Chroma获得了1800万美元的种子轮融资。他们的工具能够为不同的LLM应用程序添加状态和内存,以减少幻觉并增加事实准确性。Chroma是快速增长的嵌入式数据库公司,它将与不同的LLMOps工具不断融合。

查看更多/1


(相关资料图)

2. 新品发布:June AI

June AI可以帮助用户使用简单的SQL语言回答复杂的产品问题,相信会有很多DBA开发者对此感兴趣。

June AI使用简单的英语让您回答复杂的产品问题。编写有关您的产品的问题,June AI将返回答案。如果需要,查看和编辑SQL查询,保存您的查询。

查看更多/2

3. VideoCrafter:文本到视频生成和编辑的工具包

VideoCrafter是一个开源的视频生成和编辑工具包,用于制作视频内容。

它包含三种模型:通用文本到视频生成、带有LoRA的个性化文本到视频生成和具有更多条件控制的视频生成。

这个工具包是基于GitHub的,可以免费访问和使用。

VideoCrafter是一个基于GitHub的开源视频生成和编辑工具包,用于制作视频内容。它包含三种模型:通用文本到视频生成、带有LoRA的个性化文本到视频生成和具有更多条件控制的视频生成。这个工具包可以帮助用户快速创建高质量的视频,节省时间和精力。

通用文本到视频生成模型可以将文本内容转换为高质量的视频。它可以自动生成场景、角色、动作和音效,并将它们组合成一个完整的视频。这个模型可以应用于各种场景,如广告、教育、娱乐等。

带有LoRA的个性化文本到视频生成模型可以帮助用户根据自己的需求创建个性化的视频。用户可以通过输入一些关键词和描述来指导模型生成符合自己需求的视频。

具有更多条件控制的视频生成模型可以让用户自定义视频的各种条件,如场景、角色、音效、动作等。这个模型非常灵活,可以满足各种不同的需求。

总之,VideoCrafter是一个非常实用的视频生成和编辑工具包。用户可以通过GitHub免费访问和使用它。如果你需要制作高质量的视频,那么这个工具包一定会是一个很好的选择。

查看更多/3

4. TM2D:基于双峰值模型驱动的音乐文本一体化3D舞蹈生成

该论文提出了一项新的任务,利用音乐和文本进行3D舞蹈生成,可以引导人类进行更丰富的动作。为了解决现有数据集仅包含单一模态的配对运动的挑战,作者利用3D人体运动VQ-VAE将两个数据集的运动投影到潜在空间中,并提出了一个跨模态的Transformer架构来集成文本说明。该方法在音乐和文本的条件下生成逼真和连贯的舞蹈动作,同时保持了基于两个单一模态的可比性能。

核心要点:
利用音乐和文本进行3D舞蹈生成,引导人类进行更丰富的动作。利用3D人体运动VQ-VAE将两个数据集的运动投影到潜在空间中。提出跨模态的Transformer架构来集成文本说明,生成逼真和连贯的舞蹈动作。

查看更多/4

5. Codeberg - 快速开源 GitHub 替代品

Codeberg 是一个快速开源 GitHub 替代品,是一个面向开源社区的非营利性代码托管平台。它提供了与 GitHub 相似的功能,包括版本控制、问题跟踪和 Pull Request。不同的是,Codeberg 专注于保护用户的隐私和数据安全,并提供了更加开放和透明的运营方式。

以下是 Codeberg 的三个核心优势:

快速响应:Codeberg 采用了先进的硬件和软件配置,提供了更快的响应速度和更高的稳定性,让用户在开发过程中更加流畅。数据安全:Codeberg 可以保护用户的隐私和数据安全,不会监视、分析或出售用户的数据。同时,Codeberg 也提供了备份和灾难恢复机制,确保用户数据的安全性和完整性。开源透明:Codeberg 的运营方式更加开放和透明,用户可以随时查看平台的运营状态和财务报告。Codeberg 通过社区捐赠和赞助等方式进行运营,保证了平台的独立和自主性。

查看更多/5

6. E2b推出:基于AI代理的开源IDE

E2b(english2bits)是一款基于AI代理的开源IDE,可以代替用户完成工作。E2b是完全开源的,用户可以根据自己的需求进行修改和定制。E2b采用最先进的技术,可以提高用户的工作效率和质量。

请前往GitHub Repo获取更多信息。

查看更多/6

7. 使用RLHF训练模型的工作原理

RLHF是什么?这篇文章将告诉你训练模型的奥秘

核心要点:
RLHF是一种使用人类反馈数据来训练模型的方法相比于无监督数据集,使用人类反馈数据训练模型更具优势HuggingFace的StackLLaMA是一种回答类似于StackExchange的问题的方法,可以帮助训练模型

查看更多/7

8. 混合分辨率标记的视觉Transformer技术

新闻要点:
采用混合分辨率标记的新方法可以替代标准的均匀网格,其中每个标记代表任意大小的补丁,有效地提高了图像分类的准确性。该方法采用四叉树算法和新颖的显著性评分器,构建了一个补丁马赛克,可以处理重要图像区域的高分辨率,同时将低显著区域路由到低分辨率,从而在控制计算预算的情况下获得了显著的准确度提高。这一技术的提出将有效地推动图像分类技术的发展,并为未来的计算机视觉研究提供了新的思路和方法。

查看更多/8

更多一手开发者资讯,欢迎微信关注「漫话开发者」,给每天的AI前沿科技资讯划重点!

其他开发者头条系列文章,不定期独家干货放送:

4.6|开发者头条开发者头条合集

- END -

推荐内容