git设置全局ignore

git可以设定全局ignore,这样就不用在每一个项目里面设置ignore文件。

具体的方法是首先更改git全局配置

git config --global core.excludesfile ~/.gitignore_global

然后编辑~/.gitignore_global 文件

这个文件和gitignore写法完全一致

解决sqlite中union的子句不能使用order by和limit问题

有一种场景,我们需要在同一张表中找出几个分类的文章,并且按照时间排序,通常我们会这样写(假设表名称是post):

SELECT * FROM post WHERE category_id=1 ORDER BY create_time DESC LIMIT 10

如果有多个分类,我们会考虑将几个语句使用union all连接

SELECT * FROM post WHERE category_id=1 ORDER BY create_time DESC LIMIT 10
UNION ALL
SELECT * FROM post WHERE category_id=2 ORDER BY create_time DESC LIMIT 10

但是这个语句在sqlite是行不通的,sqllite的order和limit不能在union子句执行,这个时候可以使用子查询实现,比如:

SELECT * FROM (SELECT * FROM post WHERE category_id=1 ORDER BY create_time DESC LIMIT 10)
UNION ALL
SELECT * FROM (SELECT * FROM post WHERE category_id=1 ORDER BY create_time DESC LIMIT 10)

使用expect之后无法使用rz和sz的解决方法

在机器太多的时候,我们会使用expect来自动化登录,然而使用expect之后就不能使用rz和sz了。

经过一番寻找之后,发现有一个解决方案,在脚本之前增加一个

export LC_CTYPE=en_US

注意,这个语句放到登录脚本里面就可以了,不要放到.bash_profile里面,如果放到bash_profile里面可能你当前的终端语言都变了,中文可能会乱码。

这个缺点是远程机器里面的中文可能会乱码了,如果有更好的解决方案,我会在这里更新。

mac下git配置beyondcompare作为合并冲突工具

首先安装beyond compare,下载地址: http://www.scootersoftware.com/download.php

设置为默认的merge工具

git config --global merge.tool bc

设置为默认的diff工具

git config --global diff.tool bc

在使用git megetool 来解决冲突后,会生成 备份文件 (*.orig),大多数情况下不是我们想要的,在终端中配置:

git config --global mergetool.keepBackup false

这样就不会每次在解决冲突后生成对应的 .orig文件了.

 

php开发者的sublime插件和配置

作为一个php开发者,换工作环境的时候可能会重新配置编辑器,这里给出一个比较好的环境(也是我的常用环境)。

配置篇

每家公司都会有内部的规范,但是只要公司不是特别奇葩,那么规范一般是大同小异。根据规范来设定编辑器,那么写出来的代码则很容易符合规范了。此外,一个设置好的编辑器能够大大提高编码效率!

下面是我的配置,可以根据注释自行调整

{
    // 粗体文本
    "bold_folder_labels": true,
    // 显示所有的空白字符,这样可以看出空格和tab
    "draw_white_space": "all",
    // 设置字体
    "font_size": 15,
    "ignored_packages": [
        "Vintage"
    ],
    // 全屏打开
    "remember_full_screen": true,
    // 记住打开的文件
    "remember_open_files": true,
    // 标尺
    "rulers": [
        80
    ],
    // 显示文件的编码
    "show_encoding": true,
    // 在标题栏显示完整路径
    "show_full_path": true,
    // 关闭拼写检查
    "spell_check": false,
    // 设置tabsize为4个空格
    "tab_size": 4,
    // 转换tab为空格
    "translate_tabs_to_spaces": true,
    // 避免自动拆行
    "word_wrap": false
}

一个通用配置的意义在于无论在那些机器上,都能有一个熟悉的环境来安心写代码。不会因为编辑器的别扭带来的不适感。 (更多…)

布隆过滤器(bloom filter)介绍以及php和redis实现布隆过滤器实现方法

引言

在介绍布隆过滤器之前我们首先引入几个场景。

场景一

在一个高并发的计数系统中,如果一个key没有计数,此时我们应该返回0,但是访问的key不存在,相当于每次访问缓存都不起作用了。那么如何避免频繁访问数量为0的key而导致的缓存被击穿?

有人说, 将这个key的值置为0存入缓存不就行了吗?确实,这是一个好的方案。大部分情况我们都是这样做的,当访问一个不存在的key的时候,设置一个带有过期时间的标志,然后放入缓存。不过这样做的缺点也很明显,浪费内存和无法抵御随机key攻击。

场景二

在一个黑名单系统中,我们需要设置很多黑名单内容。比如一个邮件系统,我们需要设置黑名单用户,当判断垃圾邮件的时候,要怎么去做。比如爬虫系统,我们要记录下来已经访问过的链接避免下次访问重复的链接。

在邮件很少或者用户很少的情况下,我们用普通数据库自带的查询就能完成。在数据量太多的时候,为了保证速度,通常情况下我们会将结果缓存到内存中,数据结构用hash表。这种查找的速度是O(1),但是内存消耗也是惊人的。打个比方,假如我们要存10亿条数据,每条数据平均占据32个字节,那么需要的内存是64G,这已经是一个惊人的大小了。

一种解决思路

能不能有一种思路,查询的速度是O(1),消耗内存特别小呢?前辈门早就想出了一个很好的解决方案。由于上面说的场景判断的结果只有两种状态(是或者不是,存在或者不存在),那么对于所存的数据完全可以用位来表示!数据本身则可以通过一个hash函数计算出一个key,这个key是一个位置,而这个key所对的值就是0或者1(因为只有两种状态),如下图:

(更多…)

centos7系统初初始化工作以及网站环境搭建(php7+nginx+mysql)

拿到一台做网站的主机, 我们先要做一些环境初始化的工作, 由于这些工作会有些繁琐,因此记录一下. 后面将这些流程写成一个shell脚本,一次性完成.此次工作流程如下:

  1. 安全性设置
  2. 额外的目录创建
  3. 网站环境搭建

安全性设置

一般从某云上买的主机, 默认账户是root, 为了不被暴力破解, 我们首先需要设置一个强一点的密码,不过更好的方法是禁用root, 另外创建一个用户来作为日常管理的账户.

(更多…)

python学习(一): 变量、数据类型、 控制语句、 字符串处理

这是我学习python的第一篇笔记,记录初学python的情况。按照我学习一门语言的顺序,首先需要知道这门语言的性质, 语句的写法, 然后学习学习变量以及变量的作用域、变量类型,紧接着就是控制语句,分支,循环,然后就是一些函数的使用。这样基本就可以使用一门语言。

python

简介

与 Scheme、Ruby、Perl、Tcl 等动态类型编程语言一样,Python 拥有动态类型系统和垃圾回收功能,能够自动管理内存使用,并且支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。

(更多…)