【人工智能】AI虚拟主播制作初体验：从生成数字人到视频创作全流程

Published at 2024-08-27 11:09:10Viewed 90 times

Common article

Please reprint with source link

💯AI虚拟主播

随着人工智能技术的不断进步，AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观，还能够与观众进行互动，提供更加个性化的内容体验。无论是在广告宣传、教育培训，还是在直播与社交平台上，AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索，感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象，并借助D-ID等平台让这些静态的形象“活”起来。

💯使用AI绘画工具生成数字人

首先，我们要使用AI绘画工具为我们生成一个虚拟的数字人形象，这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney，如果没有Midjourney也没关系，还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人，供我们使用。

补充：D-ID内也可直接生成数字人形象。

借助GPT生成数字人所需的提示词

首先我们要去构思如何编写创建数字人形象的提示词，我们通常会设定一些条件，比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。

以下是一些参数可以参考：

	参数
基础	国家、身份（学生/上班族/明星/网红/女装模特）、年龄
容貌	面部（眼睛/鼻子/嘴巴/脸型）、肤色、身材、追加附魔词
服装	面部（眼睛/鼻子/嘴巴/脸型）、肤色、身材、追加附魔词
场景	地点、时间、天气、光线
摄影	现实、人像摄影、构图 (占比)
动作	默认也可以设定
比例	9:16或3:4宽高比

这里提供一个现成模板用于测试

中国、网红
女明星，五官立体，身材好，
白色连衣裙
街拍，购物街道，
索尼，85mm
走路，
9:16

可以让AI为我们生成提示词

现在你是一名基于输入描述的提示词生成器，你会将我输入的自然语言想象为完整的画面生成提示词。请注意，你生成后的内容服务于一个绘画AI，它只能理解具象的提示词而非抽象的概念。我将提供简短的中文描述，生成器需要为我提供准确的提示词，必要时优化和重组以提供更准确的内容，也只输出翻译后的英文内容。
请模仿示例的结构生成完美的提示词。
示例输入：“一个坐在路边的办公室女职员”
示例输出：1 girl, office lady, solo, 16yo,beautiful detailed eyes, light blush, black hair, long hair, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, 
thighhighs,sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy, beautifully detailed background, depth of field, loli, realistic, ambient light, cinematic composition, neon lights, HDR, Accent Lighting, pantyshot, fish eye lens.
请仔细阅读我的要求，并严格按照规则生成提示词，如果你明白了，请回复"我准备好了"，当我输入中文内容后，请生成我需要的英文内容。注意，英文连着写，不要标序号。

使用KIMI、文心一言等AI工具也同样可以帮助我们生成提示词，这里以GPT为例：
以下是生成好的提示词，已加上分辨率9:16

Chinese celebrity, internet star, female, detailed facial features, attractive body, white dress, street photography, shopping street, Sony 85mm lens, walking, realistic, urban background, fashion, vibrant colors, natural lighting, candid moment. --ar 9:16

方案一：使用Midjourney生成数字人

1. 向Midjourney输入上一步GPT给我们生成的提示词

2. 放大我们需要的那张图，保存到本地。

方案二：使用TensAI生成数字人

如果没有Midjourney，可先使用这个国内的AI工具，使用在线文生图功能：

TensAI：https://tensai.tenclass.com/?invite_code=4fdhLK

1. 选择文生图功能，工具勾选M-J-P生成人像效果更佳。

2. 接着跟Midjourney一样输入提示词

3. 生成后找一张适合的进行放大

4. 保存到本地。

补充方案三：在D-ID内直接生成数字人

写到一半才发现D-ID原来也可以在线生成数字人。

生成速度挺快的，效果也不错，这样子方便很多。

💯使用D-ID生成数字人视频

在生成了逼真的数字人图像后，下一步就是让这些静态的图片形象“活”起来。这时，我们可以借助D-ID来实现这一目标。D-ID 是一款先进的AI技术平台，它能够将静态的图像转化为生动的面部动画和视频。通过D-ID，你可以为你的数字人赋予逼真的表情和语音，让他们看起来更具生命力。

D-ID：https://www.d-id.com/

D-ID注册与消耗积分说明

这里我们需要注册一下才能使用图片转视频功能

注册过程就不详细介绍了。

这个网站都是英文，所以开启了Google翻译。
注意：D-ID每个账号注册后有20个免费积分，每个代理会话消耗1个积分，生成每一分钟视频消耗4个积分（15s视频消耗1积分）。
理论上来说，如果你拥有多个邮箱，可以不断注册新账号，这样就能够持续获得免费积分，从而使点数几乎用不完。

D-ID 让数字人“活”起来

1. 点击创建视频

2. 点击上传我们的AI数字人图像

3. 可选择视频中数字人所表现的情绪和整个形象所在位置

4. 可以为数字人选择不同地区的语言，甚至是方言，并根据需要调整音色。此外，平台还支持根据你提供的音频样本进行声音模仿。

6. 在脚本处可以输入数字人视频中说的话，还可以调整说话风格、语速

可以提供本地音频供AI模仿

6. 还可以选择自定义视频中数字人所处的背景，但应该是类似PS的图层，是需要先将数字人抠图才能完美融合背景。

7. 可在视频中自定义位置加上文字，类似水印

还可自定义文字信息。

8. 可对生成视频自定义命名

9. 生成成功后可以保存在本地

💯小结

数字人这个概念其实早在前几年就已经引起了广泛关注。然而，当时生成数字人的技术还没有如今这样成熟和易于操作，更多的是一些高端玩家才能够玩转，对于大众来说几乎是遥不可及的。而现在，随着AI技术的发展，我们可以借助AI绘画工具生成数字人图像，并通过D-ID让其“活起来”，大致了解AI虚拟主播的生成，时代的发展让更多人也能感受到科技带来的便利。
本文只是对虚拟主播的一个简单制作体验教程，并不全面，还有许多功能没有深入探索。作为一个对于AI虚拟主播的初步探索，这篇文章也是为了让读者在尝试中体验到AI发展带来的乐趣，感谢阅读~

public class Main {  
    public static void main(String[] args) {  
        System.out.println(“愿你所到之处皆为热土，愿你所遇之人皆为挚友；愿你余生不负忧，自在如风常欢笑。”);  
    }  
}

原文链接：https://blog.csdn.net/2201_75539691/article/details/141474531

0 人喜欢

0 0 0

Comments

There is no comment, let's add the first one.

AI

Manitori

【人工智能】AI虚拟主播制作初体验：从生成数字人到视频创作全流程

💯AI虚拟主播

💯使用AI绘画工具生成数字人

借助GPT生成数字人所需的提示词

方案一：使用Midjourney生成数字人

方案二：使用TensAI生成数字人

补充方案三：在D-ID内直接生成数字人

💯使用D-ID生成数字人视频

D-ID注册与消耗积分说明

D-ID 让数字人“活”起来

💯小结

弦圈热门内容

A New Perspective on the Universe’s Expansion

COUNT(*) from multiple tables in MySQL

Obtain the sum of count of multiple schema and tables in one query in mysql

ORDER BY with Multiple Counts and SUM()

Django change an existing field to foreign key

Count multiple tables as one count

What is a Database Schema?

Challenges and Future Directions for AI Spark Big Model

The Integration and Impact of AI Spark Big Models in the Healthcare Industry

Advantages of AI Spark Big Models and Their Global Economic Benefit

the first experience of using a film camera

Spark and Big Data Application