hello world
2、提高《星际迷航》的分辨率(英文)
3、JPEG 图像还原(英文)
4、复旦大学研发出5亿像素的云相机,“即便在几万人的体育场内,只需拍摄一幅全景照片,就可获得每张人脸的清晰图像,进行海量数据人脸等目标的检测与识别,瞬间发现特定目标。”
6、躲过机器监控的图案
比利时鲁汶大学开发出一种二维图像,只要将其打印在衣服上面,就会令监控系统无法识别出这是一个人体。上图左侧是正常的识别,右侧佩戴这种图像以后,识别系统就失灵了,没有认出这是一个人。
7、瞳孔里的面孔
现在的很多手机摄像头,能拍出4000万像素的图片。这么高的分辨率,可以从照片里面人物的瞳孔,提取出该人看到的人脸。
英国一所大学的研究人员,最近就从照片瞳孔里面恢复了旁观者的图像。尽管分辨率低(全脸区域平均为322像素),但如果是熟人,就可以90%的成功率识别出这些图像到底是谁。研究人员提醒,不要轻易将高清晰度照片上传到公开的社交网站。
11、Image Inpainting
nvidia 官方的在线图像修复,自动生成图像缺失的部分。
6、计算机如何识别图像?(英文)
本文较通俗地介绍了神经网络的历史发展和计算原理。
2、Bing 的图像搜索
与谷歌一样,Bing 也提供图像搜索。但是,它还带有裁剪功能,可以只搜索图像的一部分。
5、AI 渲染的图像
Nvidia 公司实现了一个重大突破,它开始采用 AI 通过机器学习,自动建模,渲染出图像。
传统的方法是,GPU 根据 3D 模型渲染出图像,新技术则是不需要人工建模,AI 算法根据视频自动建模,渲染出图像。该技术可以用于快速开发 3D 游戏。
4、Adobe 公司的 Super Resolution 功能(英文)
Adobe 公司新发布了一项革命性的图像功能:Super Resolution。它可以将图像的解析度放大4倍,同时不丢失细节。这篇文章是软件作者介绍该功能。
9、Ojoy
一个网页图像工具,可以放大图片的同时,还保持同样的清晰度。
6、BackgroundRemover
一个开源软件,用来移除图像和视频的背景。
1、人工智能图像
人工智能公司 OpenAI 最近推出了 CLIP 模型,经过训练以后,可以根据用户提供的文字描述,自动生成图像。
研究人员已经用它生成了许多非常酷的图像,有些堪称是艺术杰作。如果不说明,你根本想象不到这是软件生成的。
下面就是其中一些作品,标题就是给出的文字描述,图像是软件返回的结果。
《城市的夜》
《起风了》
《山顶的暴风雪中有一个小木屋,黄昏时亮着一盏灯》
《午夜,山中的房子,飞舞的萤火虫(使用吉卜力工作室的风格)》
6、colorSpace
一个网页工具,可以去除图像里面的用户指定的颜色,对去除背景很有用。
6、tiler
一个将小图像拼成大图像的工具,设计马赛克镶嵌画的最佳工具。
3、I Ching
有人用中国古代《易经》的六十四卦象,作为二维码的图像,编码和解码库都已经开源了。 4、ml5.js
一个基于 TensorFlow.js 的机器学习封装库,提供方便易用的 API,可以用于图像分类和视频分类等常见用途。 5、随机数函数的图像(英文)
作者写了一个工具,可以生成随机数函数的图像,从而判断随机数生成是否有规律。上图中,明显randomC
函数比较理想。
6、webcam-filters
Linux 软件,为摄像头的直播视频添加各种实时的图像过滤器(目前只有背景模糊这一个过滤器),适合用于视频会议。
11、几何艺术占位符图像
该网站提供占位符图像(Placeholder),图像内容是算法生成的几何图形。 1、像素人像的高分辨率化
1993年的电子游戏《Doom》,里面的人物都是像素图像。现在,有人通过神经网络训练,将这些像素图形转成了高分辨率图像。
2、Photoshop 的 AI 滤镜(中文)
Photoshop 22.0 版推出了一个新的滤镜包——Neural Filters,实现了很多 AI 论文的研究成果,包括老照片上色、换表情、修改年龄、提升画质、普通图像一键变梵高风格等。
1、Pixlr X
一个基于 Canvas 和 WebGL 的在线图像编辑器。
- 以色列科学家开发出一种图像处理技术,可以从水下照片中“去除水”,包括水波和光影。下面是原图和“去水”后的图片。
人工智能在图像学的应用,取得了新进展。
8月12日,阿里巴巴达摩院研发的 AliceMind 系统(已在 GitHub 开源),在2021国际 VQA 挑战赛中,获得榜首成绩,并且刷新了该比赛的得分纪录,首次超越人类的分数。
所谓 VQA(Visual Question Answering) 指的是视觉问答,简单说,就是根据图片回答问题,属于视觉-文本推理,也叫做“读图会意”,是更高层次的“图像识别”。
请看下图,图像识别工具会认出是一架飞机,而视觉问答工具则会尝试理解这张图片:它是什么型号的飞机?哪一年制造的?属于哪个国家?用什么材料做的?……
VQA 技术有着广阔的应用,可以使得图片搜索质量上一个台阶,并且在医疗诊断、智能驾驶等领域有着巨大的实用价值。据说,阿里巴巴内部已经把它用于店铺的智能客服,从商品图片提取信息,自动回答用户的咨询。
上海的公交车站正在试点显示,下一趟公交车的拥挤程度。公交线路名称后面,会显示1到3个卡通小人,分别对应“舒适、适中、拥挤”。
这项技术背后使用的是基于图像捕捉的乘客密度分析。每次车辆出站30秒后,多个车载探头实时拍摄车内画面,后台使用空间密度算法,得出乘客密度,也就是拥挤程度。这样可以避免乘客过多地集中在一部车,也为调度员调整发车频次、优化平衡车距提供数据参考。 10、Friendly Challenge
一个实验性的 Captcha (人类用户识别)开源实现。
传统的人类用户识别,一般都是图像识别。这个工具另辟蹊径,在用户计算机上执行一个计算难题,考验机器的计算能力,脚本机器人一般都不会有真实客户端的计算能力。它的好处是根本不需要用户参与。