分类
工具

centos8 设置默认为 zsh

centos 默认是 bash,自从用上了 zsh 以后,就一直用 zsh,但是 centos8 默认是没有开启 zsh 的。

安装 zsh

sudo yum install zsh

安装 ohmyz.sh

https://ohmyz.sh/ 是一个非常不错的项目,里面有很多插件和主题,如果用 zsh 的话,ohmyz.sh 是一个不可缺少的工具。

sh -c "$(curl -fsSL https://raw.github.com/ohmyzsh/ohmyzsh/master/tools/install.sh)"

安装 chsh

centos 默认是没有安装 chsh 命令的,需要手动安装

sudo dnf install util-linux-user

更改成默认的 zsh

系统默认是 bash,如果不更改默认的配置,每次登录还是 bash,要手动切换指定用户为 zsh,可以加用户名。

 sudo chsh username  -s /bin/zsh
分类
insize.app

insize 多语言的支持

最近收到 insize.app 用户的反馈,他反馈给我只支持英语,不支持别的语言,别的语言会显示成乱码,我自己测试了一下中文、日语,发现确实是乱码。

20220926xlXN3E

乱码的原因

当初在设计的时候,默认了英文,并没有考虑多语言的支持。

为什么要做多语言

有的尺码表希望同时展示多种语言,特别是一些小语种,以前有几个用户就给我提了需求,当时没有考虑, insize 也可以做全球化,不仅仅是服务中文用户,同时也可以服务世界其它卖家,有的卖家可能只会法语,他希望生成英文或者法文的尺码表。

insize. app 多语言支持

insize.app 准备支持多语言了,分几个步骤去执行。

  • 尺码图支持多语言,解决乱码的问题。
  • 全站支持多语言,菜单,模板都支持多语言。
20220926RpCVjd
分类
有意思的项目

用 pyannote.audio 实现说话人识别

如果用 Azure 的语音识别服务,他有一个说话人识别的功能,会标注这一句话是哪个人说的,特别适合在采访或者对话之类的场景,微软的确实好用,但是贵,找到了一个开源的解决方案,用 pyannote.audio 来解决,我自己对比了一下和微软的结果,基本上没有差别,这样完整的语音识别方案就用了。

说话人识别

20220922yESnWy

从上图可以看到能识别到不同的人,speaker_SPEAKER_01、speaker_SPEAKER_00 就是不同的人说的话,并且能显示时间段。

完整的语音识别开源解决方案

https://github.com/openai/whisper 实现语音转文本,用 pyannote.audio 实现对话人识别,基本上能满足大部分场景了。

分类
创意 有意思的项目

openai 开放其语音识别模型 whisper

openai 开放了其语音识别模型 GitHub – openai/whisper

hisper是一个通用的语音识别模型。它是在一个大型的多样化音频数据集上训练出来的,也是一个多任务模型,可以进行多语言语音识别,以及语音翻译和语言识别。

只是把模型公开了,但是怎么样训练的并没有开源,把训练的结果开放给大家下载使用。

openai whisper 博客简介

Whisper是一个自动语音识别(ASR)系统,它是根据从网络上收集的680,000小时的多语言和多任务监督数据进行训练的。我们表明,使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术语言的稳健性。此外,它还能实现多种语言的转录,以及从这些语言翻译成英语。我们正在开放模型和推理代码,作为建立有用的应用程序和进一步研究稳健语音处理的基础。

安装

在 linux 上面安装非常方便,依赖 ffmpeg,我的是 centos,直接编译 ffmpeg 是最快的。

安装 yasm

sudo yum install yasm

安装 ffmpeg

git clone https://git.ffmpeg.org/ffmpeg.git

./configure --enable-shared

make -j 4

sudo make install

修改连接依赖

在 /etc/ld.so.conf 添加如下内容

/usr/local/lib/
/usr/local/lib64/

检查连接库

sudo ldconfig -v  | grep code

安装 whisper

sudo pip3.8  install git+https://github.com/openai/whisper.git

运行语音识别

 whisper a.mp3  --language en  --model medium

我对比了几个常用的语音识别引擎,包括 azure,whisper 基本上与他们保持一致。

应用场景

语音识别的场景应该还是很多的,比如多人会议纪录,字幕生成,podcast 转文本等。

分类
insize.app

网站搞流量之搜索引擎提交

尺码表在线生成 insize.app 已经上线快一个月了,真实用户每天都在增长,新用户来源主要是靠推荐,种子用户用了感觉不错,推荐给了身边的卖家,今天把网站提交给了几大搜索引擎,搜索引擎离不开内容,所以开了一个 insize 的博客站点,名字叫 inSize – 最高效的尺码生成工具 ,这个站点主要是产生内容,做好 SEO ,所以也得提交给几个搜索引擎。

网站提交给 Google

主要是面向外贸卖家,这些卖家基本上都可以上 Google,Bing 之类的搜索引擎,所以第一个要提交的是 Google。

Google 提交入口

Google 提交入口

当 Google 验证你是网站所有者之后,你就可以提交站点地图了。

20220911Yav5zG

网站提交给 Bing

外贸卖家用 Bing 的也不少(数据来源于我的博客),所以我把网站也提交给了 Bing。

Bing 提交入口

Bing 提交入口

Bing 也会验证网站的所有者,验证通过后,也可以提交 sitemap。

20220911nXIhtQ

提交给百度

百度的提交体验真的是太难用了,忍气吞声的提交了。

百度提交入口

百度提交入口

提交了,状态一直是等待中,不知道什么时候才能收录。

20220911Bq5Idt

提交给头条

我的博客有不少量是从头条搜索引擎过来的,所以我顺便也把 insize.app 提交给了头条,反正提交的成本也不大,能引来点流量是一点,边际成本很轻。

头条搜索引擎提交入口

头条搜索引擎提交

20220911hOfnKy

头条的收录速度比百度快很多,并且也支持 sitemap。

提交给搜狗

偶尔也有点量,所以顺便也提交了,反正边际成本等待 0。

搜狗提交入口

搜狗提交入口

搜狗不支持 sitemap,只能一条一条提交。

20220911VG5oag

怎么样生成 sitemap

因为我用的是 wordrpess,所以我用了一个插件,插件叫 Yoast SEO ,很好用,有免费版,如果是付费版,有点小贵。

Yoast 设置

如果 wordpress 没有开启 Rewrite,那 Yoast 生成的 sitemap.xml 是访问不到的,必须在 nginx 上面添加 Rewrite 规则。

#Yoast SEO Sitemaps
location ~ ([^/]*)sitemap(.*).x(m|s)l$ {
  ## this rewrites sitemap.xml to /sitemap_index.xml
  rewrite ^/sitemap.xml$ /sitemap_index.xml permanent;
  ## this makes the XML sitemaps work
  rewrite ^/([a-z]+)?-?sitemap.xsl$ /index.php?yoast-sitemap-xsl=$1 last;
  rewrite ^/sitemap_index.xml$ /index.php?sitemap=1 last;
  rewrite ^/([^/]+?)-sitemap([0-9]+)?.xml$ /index.php?sitemap=$1&sitemap_n=$2 last;
  ## The following lines are optional for the premium extensions
  ## News SEO
  rewrite ^/news-sitemap.xml$ /index.php?sitemap=wpseo_news last;
  ## Local SEO
  rewrite ^/locations.kml$ /index.php?sitemap=wpseo_local_kml last;
  rewrite ^/geo-sitemap.xml$ /index.php?sitemap=wpseo_local last;
  ## Video SEO
  rewrite ^/video-sitemap.xsl$ /index.php?yoast-sitemap-xsl=video last;
}

参考

https://yoast.com/help/xml-sitemaps-nginx/

分类
有意思的项目

图像视频修复方案

Real-ESRGAN

Real-ESRGAN 的目标是开发出实用的图像/视频修复算法,他是一个开源的产品, Real-ESRGAN 需要 GPU 的支持,如果机器没有 GPU ,好像玩不起来。

replicate 有效果测试,有人用他的模型数据做了一个桌面应用 upscayl

湘ICP备2020020034号-1