向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
明清两代流行的马面裙,有哪些特点?******
中新网北京1月11日电(记者 上官云)近年来,“国潮文化”逐渐兴起,汉服成为很多年轻人的“心头好”。从精美的纹饰到到精致的款式,汉服凭借丰厚的文化内涵,在当下依旧焕发着光彩,也是社交平台上的热门话题。
何谓“汉服”?汉服有哪些款式?南通大学副教授曹喆表示,周代至汉代的衣裳多是宽衣大袖,右衽与褒衣大袖是汉服区别于胡服的主要特征。另外,明代有月华裙、凤尾裙、百褶裙等裙式,如今人们比较熟悉的“马面裙”,是明清两朝最流行的裙子之一。明中期以后流行一种称为马尾裙的衬裙。
款式与功能
精美的汉服,无疑是许多传统文化爱好者的宠儿。
资料图:汉服展示。安源 摄曹喆介绍,“汉”字本意是天河,汉朝建国时以此作为国号,原先的华夏族也就被称为汉族。中国历史悠久,几千年来,汉服经历了多次胡汉融合。
因此,汉服来源多样,形成了款式极其丰富的汉服系统,这恰恰是历史积淀的结果。可以说,汉服是一个服饰系统,不是一种风格或类型。
如果按功能分类,汉服有祭服、朝服、公服、常服、燕服等,类似于今天的大礼服、小礼服、工作服和休闲服的分类方法。
按款式分类,则有深衣、袍、衣裳、襦裙等等。古代典章制度还按照礼仪和官级对服饰分类。研究者通常依据研究目的确定使用哪种汉服分类法。
不过,为了便于研究,可以把汉服归为三种基本款式,分别是衣裳制、深衣制和袍服制。因色彩、长短、宽窄、纹样、配饰等不同,这三种基本款式有很多变体。
汉服的“衣裳制”
《周易•系辞》有云:“黄帝、尧、舜垂衣裳而天下治”。
曹喆说,从商代出土的人物造型玉器可以粗略看出,当时贵族是“上衣下裳”的着装。衣裳有可能是汉服最早的普遍使用的类型。
穿在上身的称为衣,穿在下身的是裳。大礼服往往都是衣裳制。如冕服采用的是衣裳制,不同朝代的冕服在冕冠、图案、尺寸以及颜色等细节上略有区别。
资料图:此前,四川省成都市玉林东路上演了一场国潮汉服巡游活动,30名汉服爱好者身着传统的汉服行走在街头,吸引过路行人。余轩 摄在一些重要场合,士人也穿上衣下裳。曹喆说,《礼记》记载,士人接受冠礼时头戴爵弁,穿纁(浅红色)裳。
周代至汉代的衣裳都是宽衣大袖,这也是汉服区别于胡服的主要特征之一。胡汉文化交融过程中,汉人衣裳出现收窄变短的款式。
早期的汉服款式相对较为单一。慢慢地,汉服款式越来越多,出现了襦裙(袄、衫)、袍、袴褶、半袖等,衣裳有宽有窄,领子有交领、圆领、立领等,装饰纹样更是几乎不计其数。
所以,曹喆认为,要总结汉服特征,大致可以这么判断:汉服具有符合汉文化、礼仪要求,且符合中国人审美需求的特征。
明清流行马面裙
对古代服饰研究者来说,古代典籍、绘画等记录的题材大多数关于“帝王将相、才子佳人”,如官服、贵族服饰等相对比较详细,出土的壁画和实物也多来自皇室或贵族墓葬。
曹喆表示,相较而言,明朝留下的小说、笔记、绘画以及实物资料较为丰富,比较有利于人们了解明代百姓的穿衣情况。
资料图:图为扮演水仙花仙子的汉服爱好者。 高铖 摄明代织造业发达,彼时江南是丝绸的织造中心,可以织造各种高级面料。明晚期,流行轻薄面料,据范濂《云间据目抄》所记,明代面料样式多样,不可胜数。明代晚期的老百姓只要经济条件允许,基本是爱怎么穿就怎么穿。
男装主要有贴里、道袍、直掇、程子衣等。《云间据目抄》中提到男人都穿“细练褶”,这是从元代辫线袄演变出来的一种袍衫,上身和下裙在腰间缝合,裙腰下有褶。
此外,明代女装主要有衫、袄、褙子、比甲及裙子等。弘治年间妇女衫、袄很短,仅掩至裙腰,发髻不高。嘉靖初年,衣衫大至膝,裙短褶多,发髻很高。
明代男女都使用一种衬裙,使用马尾织成,称为马尾裙,它能把外裙撑开,人显得宽大。此外也流行裙袄,袄用大袖圆领,裙用马面裙。
明代有月华裙、凤尾裙、百褶裙等裙式。可以这么说,马面裙是明清两朝最流行的裙子之一。一般来说,马面裙一周有四个裙门,两两相叠,两侧有褶,正面没有褶。
明代服饰样式和风格多样,部分服饰一直沿用到清末。戏剧用明式服装的传统一直流行到现在。明初时,一般老百姓的婚礼可以用九品官的服装作为婚礼服,新郎也称新郎官或新官人。
汉服是文化的直观体现
一般情况下,穿着者传达服饰的意义主要包括个性(品味)暗示和身份(职业)暗示两方面。
曹喆提到,中国人对“意义”非常重视,“以符号的方式表达含义是我们的文化传统。器物上的纹饰基本都是符号,体现了趋吉避凶的含义,服饰上的纹样更是难有例外”。
曹喆作品《汉服》。中华书局出版女式汉服上使用频率最高的纹样是牡丹、蝴蝶、凤凰等纹样,男式汉服使用频率最高的纹样则是寿纹、云纹、回纹等。
此外,汉服纹样往往将各种吉祥含义的纹样凑到一起,如一幅画面同时有寿桃、蝴蝶、蝙蝠、如意等图案。以象征婚姻美满的纹样为例,有和合二仙、凤穿牡丹、蝶恋花、并蒂莲等。
汉服和礼仪密切相关。服饰礼仪展示的是服饰规范,与社会秩序、道德修养、物质生活等内容有关。《周礼》记载了五礼:吉礼,凶礼,军礼,宾礼,嘉礼。
《礼记·王制》则总结了社会生活的六种礼仪:冠、婚、丧、祭、乡、相见。无论哪种礼仪场合,都对服饰有规范要求。时至今日,人们在正式场合按照礼节穿衣的传统依旧留存。
很多人都在不知不觉中参与了服饰的设计。比如穿衣服的时候,要考虑到服装如何搭配,这个过程,实际就是服装设计过程的一部分。
“中国人教育孩子,要求‘形端表正’,要做到这一点,需要‘正衣冠’,即衣服和帽子要穿戴端正,外表清洁整肃,内心同样要纯净正派。”曹喆表示,汉服是文化的直观体现,反映出穿着者的文化取向或者归属,服装和人的精神面貌联系甚为紧密。(完)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |