I am LAZY bones?
AN ancient AND boring SITE

充分利用磁盘空间,打开ext文件系统的保留区块

今天,吼吼来找我说,他的硬盘,有个分区一共有234G,但是只用了222G,就报满了,无法继续使用了。
其实这个问题,我不久前刚看过一下,只要你仔细看 mkfs.ext3 的man page,就可以知道原因了,其中有这么一句:

也就是说,ext文件系统,包括ext2、ext3、ext4都会默认预留5%的磁盘空间,留给root用户维护系统或者记录系统关键日志的时候使用,这也就是导致普通用户无法使用部分磁盘空间的原因了。
我个人觉得,这个选项用在根分区或者/var之类的分区,还是有一定的必要性的。但是如果是/home、/opt或者干脆是/data之类的数据分区,就显得有点多此一举了。而且,现在的磁盘空间越来越大,5%往往会有10多G,都可以存一部高清了。这么多空间浪费了,是不是太可惜了呢?
于是,就去找相关资料,看能可否在不格式化的情况下改变保留区块的大小。
吼吼找到了这个,比我想像得还要简单,甚至都不需要umount分区,就可以进行修改。
具体操作过程如下,已经加了详细注释:

看到了吧?就一眨眼的功夫,我就多了3G多的空间,哈哈。而且我还不是直接完全去掉保留区块呢,也留了百多兆以防不时之需呢,呵呵。
算了一下,吼吼那个3.4T的磁盘阵列,省出来的空间居然比我的整个硬盘都大。嗨。。。

用“函数属性”来避免C中格式化字符串时可能存在的错误

为了说明这个问题,先来看下这个简单的C程序:

这程序用gcc编译,即使是用 -Wall 打开所有的警告,也是不会有任何报错的。
但是执行结果是什么呢?由于 writeLogInfo 的是一个参数里指定的是 %s ,而第二个参数确是整型数字 123。所以程序义无反顾地出现了“段错误”而崩溃掉。这种问题在项目代码超过万行以后,要debug起来,也是会浪费很多时间的。
有的人会发现,如果把main里的writeLogInfo直接换成printf,那么在编译的时候,gcc会报一个警告:“警告:格式‘%s’需要类型‘char *’,但实参 2 的类型为‘int’”(Gcc4.x默认就会报,Gcc3.x要加 -Wall 选项才报),如果我们自己的定义的writeLogInfo函数也能有这个警告,那么这种bug将在编译的时候就可以完美解决了。
那么具体怎么实现呢?先来看下面这段代码,功能是和上面的完全一样的,连错误都一样,呵呵:

当你尝试用gcc编译这个文件的时候,你就可以看到警告了,哈哈。
可以看到,这里的关键就是“__attribute__((format(printf,1,2)))” ,这句话的作用就是告诉编译器,前面这个函数呢,参数类型是类似printf的,格式化字符串在参数的第1个位置,扩展参数从第2个位置开始,然后编译器就明白了~
然后,上面的4~6行呢,是为了兼容非Gcc的编译器而加的,这样其他的编译器就会直接无视整个 __attribute__ 了,这样至少不会报错。
其实,这个检查格式化字串的功能(format),只是“函数属性”的一个而已,另外还有许多有用又有意思的属性,比如函数的别名啊(alias),是否已经过时啊(deprecated),等等~要了解这些用法的话,建议去看看官方文档

人生能得几回醉

昨天,我喝醉了。
直到现在,才基本缓过神来,所以,起来写点东西纪念一下。
昨天是我大喜的日子,请了大学、高中同学们喝我的喜酒,对了,还有网友代表TualatriX也来了。虽然规模不是很大,但是,觉得大家的气氛都蛮好的。非常感谢所有到场的人。
其实,在酒店里,我还没怎么醉,但是后来大伙又提议去K歌,于是,在包厢里,唱了几首歌,又喝了几瓶,就彻底醉了。
呃,觉得脑子还不是很清醒,再睡一觉再说,哈哈。

nginx 对某些 User_Agent 进行限速的方法

本文为nginx 禁止某个 User_Agent 的方法的姊妹篇,不知所云的话,建议先看看这文。
由于之前已经将某个特别疯狂的迅雷的User_Agent给封掉了,所以最近一段时间,我的那源服务器也运行地比较稳定,但是今天,Linux Deepin 9.12正式发布了,由于我给Deepin做了一个iso的镜像,所以服务器又经历了一个访问高峰,如下图:

从这里也可以看出Linux Deepin的受欢迎程度,哈哈。
可以看到从11:00以后,100M的带宽就已经被完全撑满了。。。一看日志,大部分又是迅雷干的,但这次迅雷不是用某个特定的UA来访问了,而是各有变化,但是却都包含MSIE,哈哈。
当然IE用户直接访问的话,也会有这个MSIE,但是没办法,为了保全Ubuntu APT-HTTP的合法权益,只能限制一下MSIE了。
但是怎么限制呢?总不能人家用MSIE的连主页面都打不开吧?哈哈,最好的办法就是限速,于是,有了这个配置:

让我们邪恶的看一下效果,哈哈:
wget的默认UA的时候:

UA里含有MSIE的时候:

某个该死的特定UA:

从上图也可以看到,做了这个设置以后,从14:00左右开始,服务器的流量虽然还是比较大,但是已经趋于正常了。
所以,偶尔要从我源里下东西的同学,可以用firefox直接下载,也可以用axel或者wget之类的工具下,但是千万别用IE相关的工具,不然,后果自负,哈哈~

开源的命令行OCR软件──tesseract

tesseract-ocr是一个跨平台开源的OCR软件(Optical Character Recognition,光学字符识别),它历史悠久,早期是HP实验室的项目,现托管于google code。
大部分常用的linux发行版,应该都在源里包含了此软件,所以ubuntu下只需要 sudo apt-get install tesseract-ocr tesseract-ocr-eng 就可以安装了,注意必须安装 tesseract-ocr-eng 这个是识别英文字符所必须的数据文件。而在gentoo下,也只需要 emerge app-text/tesseract 就可以了,但是也必须给这个包添加 linguas_en 这个use,才会安装所需要的数据文件。
关于数据文件,还得交代一下,其实tesseract在2.0版以后,已经有了学习能力了,如果你想提高某个字体的识别率,或者识别不在默认语言包里的UTF-8字符(比如中文)的话,可以安装这个方法来训练出自己的数据文件。
这个OCR软件能干嘛呢?典型地应用就是识别验证码,哈哈。所以以这个为例,来介绍一下使用方法,先来看看这几个验证码(可“图片另存为”,然后自行测试):

这几个都是用默认的数据文件能正确识别的例子,由于tesseract只识别tiff格式的图片文件,所以识别之前,需要将图片先转成tif格式,具体如下:

同时,也有些比较难的验证码,是程序不能正确识别的,如下几个就是例子:

虽然识别的正确性不是非常高,但是已经很不错了,哈哈。
PS: 有没有人训练个识别google验证码专用的数据文件?

grub故障一例

昨天,心血来潮进了一下许久没有使用过的ubuntu,然后顺手给它升级了一下,发现这个把月已经有200多M的更新了,其中也包括内核在内。
于是开开心心地dist-upgrade完了,也没啥异常。但是到了昨晚,再开机的时候,发现机器没有正常显示grub菜单,而是直接进入了GRUB>这样的命令行。幸好我还记得几个grub的命令,瞎蒙地还算是启动了我的gentoo,然后上网一google,发现这个问题和我之前把文件系统全面升级到ext4有关:在升级了文件系统以后,再升级内核的话,就会导致grub找不到某些文件而无法正常工作。
解决办法就是在gentoo里chroot到ubuntu的/分区(因为我的grub是在ubuntu下安装的),然后执行:

如果没报什么错误的话,那恭喜你,你的grub又回来了。
当然,有人会问:如果我硬盘上没有gentoo或者记不住grub命令无法启动的话,怎么办呢?其实很简单,你只要随便找个linux的LiveCD,或者U盘系统之类的,启动以后,就一样可以chroot了。
哈哈,linux很灵活,所以基本是不死的(当然你要对它有足够了解才行)~

python代码风格检查工具──pylint

pylint是一个python代码检查工具,可以帮助python程序员方便地检查程序代码的语法和风格,通过这个工具,可以使你的python代码尽量保持完美,哈哈。
具体可以检查什么东西呢?
比如你写了 from XXX import * 了,它就会提示你这样import是不好的。
比如你操作符的前后没有空格,它也会提示你。
比如逗号后面没跟空格也会。
还有你import了没用到的模块,定义了没使用的变量等也会提示。
还有你的变量名是否符合规范也会提示。
总之它提示的内容很多很全面,而且它最后会给出一个所检查的代码的总体分数,如果能达到满分10分的话,简直就是神作了,因为pylint本身的代码也才9.5分左右,哈哈。
比较惨的是,TX发现这个工具以后,检查了几个python项目的分数,都不是很高,我那gmbox得了2分多点,还算是高的。不过,经过一番优化,现在的gmbox已经有6.64分,及格了,哈哈。。
值得一提的是,pylint不仅可以像默认那样输出字符结果,还可以彩色化输出,甚至还可以输出HTML和visual studio的格式。具体用法可以参见man页和这个文档

简单的WP备份脚本

现在,写blog的人是越来越多了;这部分人里,自己建站的也越来越多了;又在这部分人里,用WP来建的也越来越多了。
而建过站的人,都知道备份的重要性。但是手工备份又显然太麻烦了,所以我写了这个脚本来自动备份,放cron里以后,基本上就不用去关心什么了,哈哈,不过在加crontab的时候,要注意用户,如果是用root跑,可能会因为读不到当前用户的key而备份失败哦。
条件是你的空间支持ssh登录,并且事先做好了rsa公钥,登录的时候不需要输入密码。
此脚本会生成两个文件,一个是文件的打包,一个是数据库的打包。上脚本吧:

PS: 稍作修改应该也可以用于非WP的blog系统。

关于网上银行

今天,我几乎是花了整个下午的时间,做了一件本该很简单的事情——用网上银行买了两张机票。就来说说我在linux下使用网银的经历吧。
今年我新婚不久,想在这个冬天带着老婆去海南渡蜜月,计划了很久,由于经费不是充裕,决定不用任何旅行社,来次完全自主的自由行。
这不,今天选好了机票,在航空公司的网站下了订单,到了支付环节,卡住了,本打算用老婆的信用卡付钱的,但是偏偏这个航空公司是不支持宁波银行的信用卡的。
无奈,看了一下,支持招商银行,心想正好我也有张招行的卡,就用这个吧。但是试了几次失败以后,终于明白我的招行卡根本没有开通网上银行的支付功能,怎么办呢?打了95555咨询以后,说必须带身份证和卡去柜台申请,获得授权码才可以开通网上支付功能。
没办法,咱就去呗,幸好银行周末还是上班的,离住处也不是非常远(虽然也不算近)。
于是兴冲冲跑到银行,填表,还算顺利,没几分钟就办好回来了。得到一个授权码,说是可以凭这玩意获得一个数字证书文件,而且授权码只能使用一次。
由于之前一直在linux下,我也知道网银和航空公司的网站对linux和firefox的支持都很有限,于是操作都在vbox的虚拟XP里进行,所以到了这一步,虽然也曾听闻招行的网银不能在vbox下使用,但是心里仍然存在侥幸心理,万一能的话,就不用重启了,再说,真不能用的话,到时候提示了再重启也不迟嘛。于是,悲剧就这么发生了:我在vbox里下载网银的一个什么客户端,然后用刚申请的授权码启用了数字证书,一切都很顺利,正当我心里暗爽的时候,问题终于发生了:我登陆不了。。。而授权码已经使用,并且和本系统(Vbox的Guest系统)绑定了,但这个客户端是在登录的时候,是会检测系统的键盘状态的,也就是说,不管是USE外接键盘、屏幕软键盘还是远程桌面连接过去的键盘,都会因为传说中的安全问题,而被禁用。当然虚拟机的键盘也就被禁用了。
于是,我只能再跑一次银行,再填表,再申请一个授权码,回来重启到真正的XP下面,再安装客户端,然后获取数字证书,才算完成了支付过程。期间,那订单都超时作废了好几次了。

综上所述,我对现有的网银有如下抱怨:
抱怨1:现在国内的网上支付业务,没有一个绝对权威的机构统一管理,导致商家和银行的合作不全面,这样才导致了部分航空公司支持这几个银行的卡,另一些又支持那些银行的卡。为什么不成立一个类似“银联”的机构,把这个接口规范化呢?如果今天航空公司支持宁波银行的卡的话,也就不会有后面这一堆破事了。
抱怨2:这也是linuxer的普遍抱怨,网银对linux的支持太不友好了,又是ActiveX控件,又是exe的客户端,这些落后的技术到底要折磨我们到何时呢?这个老生常谈的问题也就不多说了。
抱怨3:就是针对招行的了,既然你不允许vbox的系统登录客户端,为什么在客户端里启用证书的过程中完全没有提示呢?这也是我今天最火的事。先不说你判断物理键盘进行安全认证有没有道理,至少,都是同一个程序,要检测的的话,完全有可能在程序一启动的时候,就进行运行环境的检测,而且在数字证书的签发过程中也是必然会进行系统信息的收集的(因为证书和系统是一一对应的),但是程序在启动过程和信息收集的过程都没有进行提示,却在数字证书安装完了以后,登录的时候再提示。也就是说,这时,授权码已经失效了,而且数字证书的备份也要在登录以后才能进行,刚刚好在这个节骨眼上,给你卡住了。这还能算是经过人的大脑设计出来的程序吗?

好了,遇到这事,咱也只能抱怨抱怨了事了,呵呵。接下来还是很期待这次三亚蜜月行的,哈哈。

PS:支付完了以后,在IE下写这文,发现IE下的WP后台真难看,哈哈,不过拿sogou拼音打字确实挺快。

监视文件系统的一举一动 ── inotifywait

某天,TX大侠说他找不到awn的配置文件在什么地方,问我知道不?而我只是在N年前用过一下下awn而已,所以,理所当然地不知道了。后来,我们想了一个土办法:
在$HOME下先执行一次

然后在awn的界面里修改一下配置,再在$HOME下再执行一次

然后再

哈哈,别说,这样还真把需要的配置文件找到了。但是,谁看着这个方法,都多少会觉得有点别扭。
现在,我发现了这个可以监视文件系统的任何动作的工具: inotifywait (项目主页) 。
inotifywait 包含在gentoo的 sys-fs/inotify-tools 包里,其他发行版应该也是叫这个名字。
这个工具是使用linux内核的inotify调用,来实现监视功能的。所以你需要有2.6.13以上版本的内核,才会有这个调用。
像上例中,如果要找某个未知文件的该动的话,你可以监视整个$HOME目录,这样:

现在你再修改awn的配置,或者打开/修改/删除任何$HOME及其子目录下的文件的话,终端都会显示出来。比如:

这个就是我在~/test下执行

的时候的结果,很详细吧?

另外值得注意的是,如果你 $HOME 下的文件数目比较多,大于 /proc/sys/fs/inotify/max_user_watches 里的值(默认才8k)的话,inotifywait 就会提示超出限制,报错了。这时候你可以估算下总的文件数,然后手工修改上限值。

我这边把上限改成了170000,发现CPU和内存的占用都还不是很明显,还是完全可以接受的。

PS:除了使用这个inotifywait以外,你也可以在自己的程序里直接调用内核的inotify完成某些特定的功能,而且python和perl都有相应的模块可以直接调了,更详细的介绍可以看这里(翻遍了google,好不容易才找到这原文啊,BS那些转载不注明原地址的,还有转了以后,不管代码格式却分成10来页骗点击量的)。