分类
创意 有意思的项目

openai 开放其语音识别模型 whisper

openai 开放了其语音识别模型 GitHub – openai/whisper

hisper是一个通用的语音识别模型。它是在一个大型的多样化音频数据集上训练出来的,也是一个多任务模型,可以进行多语言语音识别,以及语音翻译和语言识别。

只是把模型公开了,但是怎么样训练的并没有开源,把训练的结果开放给大家下载使用。

openai whisper 博客简介

Whisper是一个自动语音识别(ASR)系统,它是根据从网络上收集的680,000小时的多语言和多任务监督数据进行训练的。我们表明,使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术语言的稳健性。此外,它还能实现多种语言的转录,以及从这些语言翻译成英语。我们正在开放模型和推理代码,作为建立有用的应用程序和进一步研究稳健语音处理的基础。

安装

在 linux 上面安装非常方便,依赖 ffmpeg,我的是 centos,直接编译 ffmpeg 是最快的。

安装 yasm

sudo yum install yasm

安装 ffmpeg

git clone https://git.ffmpeg.org/ffmpeg.git

./configure --enable-shared

make -j 4

sudo make install

修改连接依赖

在 /etc/ld.so.conf 添加如下内容

/usr/local/lib/
/usr/local/lib64/

检查连接库

sudo ldconfig -v  | grep code

安装 whisper

sudo pip3.8  install git+https://github.com/openai/whisper.git

运行语音识别

 whisper a.mp3  --language en  --model medium

我对比了几个常用的语音识别引擎,包括 azure,whisper 基本上与他们保持一致。

应用场景

语音识别的场景应该还是很多的,比如多人会议纪录,字幕生成,podcast 转文本等。

分类
创意

低代码平台体验

webflow

优点

  • 功能非常强大,模板多。

缺点

  • 不能整站导出
20220712kAooqX
20220712kaY5Mv

typedream

优点

  • 简单,没有 webflow 复杂

缺点

  • 模板相对较少
20220712MECBqc
20220712H5at8u

ant design

优点

  • 开源
  • 可以导出

缺点

  • 适合开发人员,导出来还要自己 build 成 html

Ant Design Landing Page – Ant Design Landing 模板与规范

20220712EUVRYN

tooljet

优点

  • 注重流程
  • 开源

缺点

  • 模板相对较少
20220712467ZVz

Tooljet | Open-source low-code platform to build internal tools

分类
创意

我请了一个巴基斯坦的工程师

我经常要做一些小的 web app,比如最近在实现的 size chart app,给服饰卖家提供尺码生成的一个小工具,从我的经验来看,完全可以找海外的程序员来实现,在价格、交付质量、交付速度方面有很多优势。

20220626BzvYBr

国内外包历程

我这个 web app 主流程是选择一个模板,提交一个表单,生成一张图片,图片是在服务器上面生成的,用户可以下载这种生成的图片。

分类
创意

Github Action 与 Laravel 自动发布

不想每一次 push 后,手工去服务器上拉取代码,github 的 action 功能,可以自动 push 到我的服务器,这真是一个强大的功能,省去了很多麻烦。

我主要是参考了这个文章 Build, Test, and Deploy Your Laravel Application With GitHub Actions (twilio.com) 体验下来,发现一个不足的问题,就是 ssh 权限的问题,必须要给一个 ssh 的 private key 才可以。

还有一种解决方案 Install and configure Deployer | Deploy your Laravel app from scratch | Loris (lorisleiva.com) 就是用 Deployer,个人不是特别喜欢,How to create a CI/CD for a Laravel application using GitHub Actions – LogRocket Blog 这种方法可以指定到某一个版本。

20220614np4Y5N
分类
创意

全息投影技术

瑞典国宝乐队 ABBA 告别舞台多年,终于以 Voyage 演唱会重归舞台 几位主唱都是 70 多岁爷爷奶奶,就算他们愿意上台,保险公司肯定也不答应 所以主办方参照他们巅峰时刻的造型,创造了虚拟偶像,真是万物都可以虚拟。

顺便了解了一下这个技术,叫做全息投影,英文叫(hologram),好像理论基础是佩珀尔幻象,这个技术没有仔细研究,但是比较有意思,看来万物可元了(meta)了。

2022060580ySP2

虚拟偶像的 ABBA

分类
创意 工具

用 Canvas 画图

想画一个尺码表,试了一下 Canvas,发现还真能实现,自己对前端图形图像这一块关注的太小,很多设计工作都已经迁移到了浏览器,打开浏览器就能设计,最典型的是 figma,canva,他们基本上把一些传统的设计软件在浏览器里面实现了一次,并且支持多人协作。

20220602YM6AgE

上图中的那个绿色的箭头就是我用 canvas 画的,没有几行代码。

分类
创意

十个有意思的生成艺术(generative-art)推荐

最近在生成头像,顺便了解了一下生成艺术(generative-art),感觉很有意思,所谓生成艺术,我的理解是通过代码或者程序来生成艺术作品,open-ai 就可以根据输入几个词,生成一副艺术作品,有人把这些生成的艺术作品与人类亲手创造的艺术作品放在一起,让人区分,发现很难区分是生成艺术还是艺术家自己亲手创造的。

prettymaps

GitHub – marceloprates/prettymaps: A small set of Python functions to draw pretty maps from OpenStreetMap data. Based on osmnx, matplotlib and shapely libraries.

20220524m8Hwm2

这个是可以把地图生成艺术作品,有人用这个生成的艺术作品当作 NFT 来卖,挣了不少钱,作者看不下去了,说不赞成用这个来弄 NFT,但是作者也很明天,他无法强制之行,因为这个代码是开源的。

分类
创意 育人育己

深度工作

最近感觉好久没有深度工作,我以前写代码的时候,能感觉到我每天能深度工作几个小时,后来慢慢从事一些管理工作,基本上是被各种会议安排,深度工作的时间相对少了一些,我知道要完成一件事情,如果不深度工作是不行的,所以准备对我的工作进行相应的调整。

A woodpecker can tap twenty times on a thousand trees and get nowhere, but stay busy. Or he can tap twenty-thousand times on one tree and get dinner.

202204187hVK1U
分类
创意 建房子

我决定回乡下建一座房子

最近差不多一个月没有更新博客,其实我写了不少东西,也开通了一个语雀的话题板块,只付费买了 100 个席位,我把“时间的复利”这个群里的人基本上都邀请进来了,大家分享一些每天的所见所得,其实挺好的,微信群主要是用来吹水,其实没有什么意义,如果有兴趣分享一些有成长性的东西,欢迎加入,大概还有 30 来个席位。

理性经济人

从理性的经济人来说,不应该回湖南的深山老林建房子,建一个两层的房子,花费也在 60 万左右,平均装修水准,80 万左右可以在长沙非核心区买一个,就算在镇上买一个或者县城买一个,从收益的角度来说,是一种资产,但是在老家的深山老林建一个,那是一种消费,因为我建好后,基本上只能自住,有买家的可能性非常小。

图片来源于网络
分类
创意

2022

我们今年 review 一下我们的使命,使命还是没变:和几个有意思的人,大干一场,做几款有意思的产品,挣到足够的钱,然后大家分了,悄然离去。

21 年我搬到了深圳,深圳给了我一种全新的体验,看了一下 21 年的出行单,发现有一年没有回北京了,我同时在中国的两个一线城市,北京和深圳都生活过,说不出更喜欢哪一个城市,每一个城市都有自己的特色,对于只在一个城市生活过的人,肯定是没法理解的,当时搬家到深圳身边很多人不是特别理解,说在北京什么都有了,有成熟的人际圈子,有房子车子之类的,为什么要搬到深圳去,我在思考,为什么一定要呆在一个地方呢?结果来深圳很快就适应了,在这边认识了不少有意思的人,也有了自己的圈子,又从事了自己喜欢做的事情,把视野从国内完全转移到了全球,以前只盯着国内市场,没想到视野一换,就没有那么内卷了,我一般不给任何人建议的,以下是我自己总结的一些想法,有可能不成熟,我每三个月左右就会发现以前的想法是错的,或者认为自己前三个月很SB,如果有人看到这文章,不要把他当作任何建议。