★计算机生成的图像与真实世界的图像
在技术水平蓬勃发展的背景下,计算机能够根据一些具体的要求生成一幅图画作品,其生成的图像主题突出,足够以假乱真。计算机像人一样具备了绘画的能力,那么它是如何进行绘画的呢?
★计算机文本生成在生活中的应用
日常生活中,有许多地方运用了计算机的数据生成。比如,机器翻译是计算机智能生成文本在生活中的一类应用,随着人工智能算法的引入机器翻译的质量也越来越高, 可以轻松快速地实现任意两种语言的互译。比如,智能客服中的对话实际上也是计算机文本生成在生活中的一个应用。
★大海捞针的随机生成
真实的生活往往因为不确定性而精彩,但是对于计算机的数据生成而言,完全的随机生成往往是不可取的。因为完全的随机就好像身处沙漠,在沙漠中漫无目的地行走,很难找到沙漠的出口。而运用人工智能的智能数据生成,就仿佛是在沙漠中拥有了前人行走的经验指导,能够顺着经验前行,同时根据实际情况形成新的经验, 有目的地得到想要的结果。书中通过有趣的实验分析,可以了解到计算机是如何通过随机方法生成单词和句子的。
★计算机智能生成句子
计算机生成一个合理准确的句子需要考虑上下文的关系? 因此一个完整的句子通常不是一次性生成的,计算机生成句子的过程和游戏中一样,每次只生成一个单词? 并把单词放入序列中,根据序列中现有的单词 (记忆中的情况) 在词库中搜索潜在的下一个单词? 并继续把新生成的单词放入序列中,根据序列 (记忆中的情况) 在词库中搜索下一个单词,这是一个不断判断、 搜索和生成单词的循环过程。
★贴鼻子游戏的启示
你玩过贴鼻子游戏吗?
不少人肯定玩过。蒙着眼睛将手中的纸鼻子贴到黑板上画着的人脸模型上。为什么机器能够准确、 迅速地判断鼻子位置不合理的情况? 猜一猜人工智能是如何判断鼻子位置是否合理的呢?
★奇妙的特征空间
人工智能通过学习各种类别图片的数据集,就能从中提取到体现各类事物差异的特点并记录为一串数字。根据某张图片对应的特征数字串可以更进一步给出图片所属的类别,这就是图像分类的过程。人脸识别的原理也是类似的,在特征空间中同一个人不同角度、 不同表情的脸部照片在空间中的分布位置更加接近;不是同一人的脸部照片在空间中的分布位置相对较远,也就是说在特征空间中分布相近的图片数据更可能是同一个人。如果让人工智能学习一个很大的人脸数据集,就可以形成一个理想的人脸特征空间。基于此特征空间,就可以完成如人脸签到、 人脸支付、 人脸解锁等一系列人脸识别的实际应用。
★从特征空间到现实世界
看,这是用电脑画的人脸图片,是不是和照片上的很像。
其实,这是电脑利用人工智能自动画出的图像。怎么实现的呢?训练好的人脸解码器就像是一个专业的 “肖像画家”,通过一定的数字编码来了解人脸关键信息,如肤色、 脸型、 五官等? 并根据数字编码中提供的
关键信息就可以生成一张对应的人脸。
《人工智能启蒙》一共六册。图文并茂、深入浅出、生动有趣。内容包括人工智能概览、手机中的人工智能、迷你小车、图像分类与物体检测、计算机视觉、语音识别、无人驾驶、智能数据生成、人工智能在更多行业的运用、智慧校园等。根据小学生的认知规律,以漫画情景引入话题,渐次介绍相关基本知识,使学生对人工智能现有的领域和方向以及常见的相关知识有通识性的认识,同时穿插一些编程小练习和小项目,以及思考题,鼓励学生参与实验,发挥想象力,提升动手能力,养成思考习惯,实现人工智能启蒙。
《人工智能启蒙》(第四册)主要向小读者们介绍了图像数据的生成,大海捞针的随机生成,计算机智能生成句子,从特征空间到现实世界,编码与解码的应用,有趣的表情包等,通过做实验、以及议一议和小贴士,让孩子们体验人工智能在生活中的运用。
林达华,商汤科技联合创始人;香港中文大学信息工程系教授;香港中文大学-商汤科技联合实验室主任。林教授在2004年于中国科学技术大学获得学士学位,在2006年于香港中文大学获得信息工程硕士学位,在2012年于美国麻省理工学院获得计算机科学博士学位。他在2012年到2014年于芝加哥丰田科技研究院任研究助理教授,在2014年8月到香港中文大学任教。林教授在计算机视觉,概率推断,与深度学习方面有广泛的研究经历,并在多个课题上取得突出成绩。他在CVPR/ICCV/ECCV/NIPS/PAMI等计算机视觉与机器学习*会议与期刊发表70多篇论文。他在贝叶斯非参建模方面的开创性工作于2010年获得机器学习领域*权威国际会议NIPS的*学生论文奖。他分别在2009年与2011年获得计算机视觉*学术会议ICCV的杰出评审员奖。他曾指导香港中文大学的研究团队参加ImageNet和ActivityNet竞赛,获得多个冠军。此外,他也担任CVPR,ECCV,BMVC,ACMMultimedia等主要国际会议的领域主席(AreaChair)。
顾建军,南京师范大学教育科学学院院长、教育科学研究院院长、博士生导师。国务院学位委员会学科评议组(教育学)成员,高中通用技术课程标准修订组组长,课程中心K12技术与工程教育南京师大基地负责人,国际技术与工程教育组织中国中心主任,中国教育装备协会副理事长,中国职业安全教育研究会理事长,世界创客教育联盟执行主席。
*节数据从哪儿来1
学习目标3
11图像数据的生成4
12文本的生成7
评一评10
第二节大海捞针的随机生成11
学习目标13
21随机的概念14
22单词的随机生成15
23句子的随机生成17
评一评21
第三节上下文的重要性23
学习目标25
31生成一句话时需要考虑语法结构26
32考虑上下文的联系29
评一评30
第四节计算机智能生成句子31
学习目标33
41序列的基本概念34
42句子的生成35
43句子的开始与结束38
评一评40
第五节条件生成41
学习目标43
51计算机“造句”——句子的条件生成44
52自动翻译47
评一评50
第六节生成模型51
学习目标53
61贴鼻子游戏的启示53
62生成模型54
63语句生成的原理57
评一评59
第七节奇妙的特征空间61
学习目标63
71特征与编码64
72初识特征空间67
73特征空间的应用初探69
评一评71
第八节从特征空间到现实世界73
学习目标75
81特征“放大镜”——解码器76
82解码“万花筒”——随机生成79
83神奇“变脸术”——特征漫步80
评一评82
第九节编码与解码的应用83
学习目标85
91自动翻译85
92看图说话87
93个性化生成人脸90
评一评92
第十节看我七十二变93
学习目标95
101图像的艺术风格96
102图像风格的转换97
评一评99
第十一节有趣的表情包101
学习目标103
111图像扭曲104
112制作我的个性动态表情包105
评一评108
第十二节人工智能作曲家109
学习目标111
121音乐的数字化表达112
122音乐的续写和生成115
评一评116
第十一节
有趣的表情包
1了解表情图片的制作原理及过程;
2学会通过图像扭曲等方法制作出个性
表情包。
学习目标
▲图11-1有趣的表情包
111图像扭曲
制作表情包有很多不同的方法,其中一种是通过对原图进行局部扭曲得到的。通过对图像不同部位的扭曲操作,可以实现不同的表情效果,进而得到一张张特殊表情的图片。将一组风格类似的表情图片组合在一起,就形成了一个表情包。
与图像风格转换和人脸的解码不同,这种直接依靠扭曲得到的表情包是对图像直接进行操作。这也是生成新图像的一种重要方式,制作一张个性表情图片所采用的技术通常包含图像的扭曲和关键点检测。
图11-2贝塞尔曲线扭曲图像扭曲是一种数字化处理图像的过程,分为全局扭曲和局部扭曲。全局扭曲指对图像中所有像素进行扭曲变换,如图11-2所示,图中是使用贝塞尔曲线对图像进行扭曲操作后得到的效果。
图11-3局部扭曲局部扭曲则只作用于图像的局部,像捏橡皮泥一样,把一个点捏动一定距离。局部扭曲的三个控制变量分别是:起点、位移、影响半径。如图11-3所示,只对小女孩面部的部分区域做了局部扭曲:
112制作我的个性动态表情包
对人脸进行合理的局部扭曲可以改变人的面部表情,从而形成表情包。制作表情包的*步需要获取人脸的各个关键点。对人脸进行关键点检测即提取面部轮廓和五官的关键点,如图11-4所示,通常包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓等。这些关键点都是人工标定的人脸中特殊的一些位置,可以通过神经网络训练得到。
▲图11-4人的面部关键点
做一做
1登录实验平台,输入一张自己的图片或者网上下载的图片,编写程序获取人脸关键点。
2以人脸中的某个关键点为起点进行局部扭曲,是不是就可以制作一些表情图片呢?编写程序尝试对图像进行局部扭曲,观察表情的变化。
实现表情静止到动态的过程其实是由多张照片连续播放产生的,肉眼认为自然的表情变化主要是靠人眼的视觉残留效应。如图11-5所示,在一幅画还没有消失前播放下一幅画,就会给人造成一种流畅的视觉变化效果,从而让人认为是连续的动作。
▲图11-5简单动画生成示意图
为了制作动态表情包,首先找到对表情影响*的四个人脸关键点:左右眉心和两个嘴角,如图11-4中的右图所示。以这四个点分别作为起点进行局部扭曲,并且控制扭曲的两个参数:位移和影响半径,就能够在一定程度内控制面部表情。而将一点点扭曲直至目标参数的中间过程中的所有图片组合在一起,就能形成一个动态的表情包了。
做一做
登录实验平台,尝试修改左右眉心和两个嘴角的扭曲参数,制作个性动态表情包。
想一想
如果输入的是一张卡通图片,无法检测面部关键点,如何选择进行局部扭曲的起点呢?
评一评
我知道制作动态表情包的步骤。☆☆☆☆☆
我能够利用实验平台制作一款属于自己的个性动态表情包。☆☆☆☆☆