胡超博客 – 第 2 页 – 程序员日常

shell 四则运算

1. 使用`expr`命令

expr命令可以用于执行基本的算术运算。注意，运算符之间需要有空格。

result=$(expr 5 + 3)
echo $result  # 输出：8

对于乘法，需要使用反斜杠 \ 对 * 进行转义，因为 * 在Shell中有特殊的含义（作为通配符）。

result=$(expr 5 * 3)
echo $result  # 输出：15

2. 使用`let`命令

let命令允许你在Shell中进行算术运算，并直接更新变量的值。

result=5
let result=result+3
echo $result  # 输出：8

3. 使用双括号`(( ))`

双括号结构允许你进行算术扩展，并且可以直接在条件语句中使用。

result=$((5 + 3))
echo $result  # 输出：8

if ((result > 7)); then
    echo "Result is greater than 7"
fi

4. 使用`bc`命令

bc是一个任意精度的计算器语言，它可以用于执行复杂的数学运算。

result=$(echo "5 + 3" | bc)
echo $result  # 输出：8

对于浮点运算，bc非常有用，因为它默认支持小数。

result=$(echo "5 / 3" | bc -l)  # -l 选项启用长浮点运算
echo $result  # 输出：1.6666666666666667

5. 使用`awk`命令

awk是一个强大的文本处理工具，它也可以用来进行数学运算。

result=$(awk 'BEGIN {print 5 + 3}')
echo $result  # 输出：8

选择哪种方法取决于你的具体需求和你所使用的Shell环境。对于简单的整数运算，双括号(( ))通常是最方便和高效的选择。对于更复杂的运算或需要浮点支持的情况，bc可能是一个更好的选择。

你可能还喜欢下面这些文章

php print 这个坑，遇到连接符从右往左执行

在使用php的时候，我很少用到print这个函数，哦，不对，这是一个语言结构，而并非日函数！看一段代码

linux命令:cd命令，改变当前的工作目录

原标题 : 每天一个linux命令(2)：cd命令Linux cd 命令可以说是Linux中最基本的命令语句，其他的命令语句要进行操作，都是建立在使用 cd 命令上的。所以，学习Linux 常用命令，首先就要学好 cd 命令的使用方法技巧。命令格式cd 命令功能切换当前目录至dirName常用范例例一：进入系统根目录命令cd /输出# cd /说明：进入系统根目录,上面命令执行完后拿ls命令看一下，当前目录已经到系统根目录了命令cd .. 或者 cd .. //输出:# pwd/opt/soft# cd ..# cd ..//# pwd/说明：进入系统根目录可以使用“ cd .. ”一直退，就

std::endl为什么导致程序变慢

最近在写hadoop的streaming任务，在输出的时候用了std::endl，就像下面这样：运行后发现程序跑的比python还慢，令人费解。我入门C++的时候，输出hello world也是这样写的，有什么问题？于是查了一下std::endl，发现问题挺大。std::endl解释如下：也就是说每次执行到std::endl的时候都会将缓冲区的内容写入到输出的对象中，这样一来速度慢也就不足为奇。性能测试不加std::endl性能高出20倍。如果程序的逻辑十分简单，那么输出字符串的时候最好用"\n"代替加std::endl

linux命令：ls用法，列出文件及目录

原标题:每天一个linux命令(1)：ls命令ls 命令是linux下最常用的命令。ls命令就是list的缩写缺省下ls用来打印出当前目录的清单，如果ls指定其他目录那么就会显示指定目录里的文件及文件夹清单。通过ls 命令不仅可以查看linux文件夹包含的文件而且可以查看文件权限(包括目录、文件夹、文件权限)，查看目录信息等等。ls 命令在日常的linux操作中用的很多!ls命令格式ls 命令功能列出目标目录中所有的子目录和文件。常用参数-a, –all 列出目录下的所有文件，包括以 . 开头的隐含文件-A 同-a，但不列出“.”(表示当前目录)和“..”(表示当前目录的父目录)。

linux命令桌面壁纸

linux命令桌面壁纸作为桌面，再也不怕记不住linux命令了

php运算符的优先级

无论在哪个语言，运算符都有优先级，就如四则运算一样。先乘除后加减，但语言的运算可不止四则。代码写的越多，越觉得运算符的优先级重要性（请原谅我是一个野生程序员）。记住运算符的优先级，能让你少些很多括号，也能体现你的水平，别闹笑话了（在有一个加法和一个乘法的式子中，还特地把乘法用括号括起来，这不是闹笑话吗）。更能够让那种无厘头的bug消失！php官方给出的运算符优先级表（从上到下，优先级依次降低）结合方向运算符附加信息无clone newclone 和 new左[array()右++ -- ~ (int) (float) (string) (array) (object) (bool) @类型和递

看看php的boolean都有哪些，以及其有趣的用法

在写if的时候，在写while的时候，总感觉不写一个true或者false就难受。是的，你还不明确php里面都有哪些值是true，哪些值是false！除了false的，都是true！php里面为false的东西布尔值本身整型值 0（零）浮点型值 0.0（零）空字符串，以及字符串 "0" 不包括任何元素的数组不包括任何成员变量的对象（仅 PHP 4.0 适用）特殊类型 NULL（包括尚未赋值的变量）从空标记生成的 SimpleXML 对象既然说了除了false以外的都是true了，那么就别天真的以为-1是false了，它也是true。有趣的boo

python学习笔记：二、流程控制

根据如何学习一门新的语言这篇文章的指导，现在的步骤就是学习这门语言的流程控制了。通常来讲，流程控制有顺序，选择，循环这几种。python也不例外，也有这三种流程控制。下面的一一学习。顺序顺序语句很简单，从上往下依次顺序执行。如：a = 1b = 2print(a+b)上面的语句就是顺序执行的语句。选择选择通常使用if和switch，但python中只有if这一个选择语句。语法是：if 满足条件1: 语句1elif 不满足条件1满足1条件2 语句2else 都不满足语句3比如用一个实际的例子a = 1b = 2if a > b: print('a>b')el

Shell中的条件判断语句if的用法

shell中的if语法是最让我头疼的语法之一，它的判断就向使用USB插头一样——拿起来插入不行，翻转再插入还不行，再翻转插入行了！为了搞清楚这部分语言，我收集了一些文章关于if条件判断的用法，希望对你也有些帮助。一、基本语法语法说明bash shell会按顺序执行if语句，如果command执行后且它的返回状态是0，则会执行符合该条件执行的语句，否则后面的命令不执行，跳到下一条命令。当有多个嵌套时，只有第一个返回0退出状态的命令会导致符合该条件执行的语句部分被执行,如果所有的语句的执行状态都不为0，则执行else中语句。返回状态：最后一个命令的退出状态，或者当没有条件是真的话为0。注意：1、表

计算机语言学习指南

这篇文章讨论基于语言的基本要素，如何快速入门一种计算机语言。是一篇语言从学习到使用的指导手册，并且这种学习方式是一个系统的学习，相比于碎片化的学习，这种学习更加不容易遗忘。语言的基本成分语言的基本成分为数据、运算、控制、传输。想想你学过的语言，是不是都是这样。归结语言的组成成分，学习一门语言可以从这四个方面下手，这四个方面掌握之后，对这个语言就有个最基本的了解了。语言基本成分：数据数据是程序操作的对象。实际上我们可以思考，一个数据拥有的属性有哪些，根据我们已经掌握的语言来说（比如PHP）。$a = 1$a是数据，那么这个数据有哪些属性呢？名称(a)，类型(int)。从这一行代码只能发现这两个属

c++ vector取最后一个元素

在C++中，你可以使用std::vector的成员函数back()来获取最后一个元素。这个函数返回对向量中最后一个元素的引用。以下是一个简单的示例：

#include <iostream>
#include <vector>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};

    // 检查向量是否为空
    if (!vec.empty()) {
        // 获取并打印最后一个元素
        int last_element = vec.back();
        std::cout << "The last element is: " << last_element << std::endl;
    } else {
        std::cout << "The vector is empty." << std::endl;
    }

    return 0;
}

在这个例子中，我们创建了一个包含五个整数的std::vector。然后，我们使用back()函数获取最后一个元素，并将其存储在last_element变量中。最后，我们打印出这个元素。

请注意，如果向量是空的（即，不包含任何元素），调用back()函数将导致未定义行为。因此，在调用back()之前，最好先检查向量是否为空，这可以通过调用empty()成员函数来完成。

你可能还喜欢下面这些文章

C++实现python字符串的endswith方法

可以使用的或方法配合比较运算符来模拟方法的功能。下面是一个示例函数，它检查一个字符串是否以另一个字符串结束：在这个示例中，函数接受两个参数：和。函数首先检查的长度是否大于或等于的长度。如果不是，那么显然不能以结束，函数返回。否则，函数使用方法从的末尾提取与长度相同的子字符串，并将其与进行比较。如果它们相等，那么以结束，函数返回。否则，函数返回。请注意，这个函数是区分大小写的。如果你想要一个不区分大小写的版本，你可以在比较之前使用和函数将和转换为小写。在这个版本中，函数首先使用和函数将和转换为小写。然后，它调用函数来检查转换后的字符串是否以结束。

Go入门：三、函数的声明和调用

这是我Go学习笔记的第三篇！接下来学习的是Go的函数声明和调用。我的语言学习过程一般分为下面几个：1. 变量和数据类型2. 流程控制方法3. 函数声明和调用4. 面向对象5. 语言特性6. 标准库函数声明func 函数名称(参数表) 返回值类型 { // 函数体}写一个函数是非常简单的，掌握语法格式就可以了。函数是一个功能的封装，能让函数体内的代码得到很好的复用。比如我要输出个人信息，我可以把个人信息封装到函数里面，后续直接调用这个函数而不是每次都print一堆信息了上面定义的函数没有参数，也没有返回值，非常简单的一个函数。如果我想让姓名可变，那么可以定义一个带有参数的函数接下来定义一个有

python中[:-1]是什么意思

在 Python 中，是一个列表或字符串的切片操作，用于获取从开始到倒数第二个元素（或字符）的子序列。对于列表：对于字符串：这里的关键是切片操作中的后面的，它表示从末尾开始计数的第一个元素之前的所有元素。具体来说，是最后一个元素，是倒数第二个元素，依此类推。因此，或都会返回从开始到倒数第二个元素的子序列。

C++入门：三、函数

这是我学习C++的第三篇笔记，函数。我的学习路径是现在学习的是函数的声明、定义、调用等相关知识。函数声明和定义函数的声明包含返回类型，函数名字，0个或者多个形参，无函数体，通常在头文件中对函数进行声明。函数的定义包含返回类型，函数名字，0个或多个形参，以及函数体。比如写一个求阶乘的函数，可以写成下面这样写一些简单的函数大多数语言都差不多，不过可惜每种语言或多或少都有自己的特色，这是比较令人头秃的地方。函数的参数函数可以带有0或多个参数，每个参数都需要声明类型。参数传递可以传值和传引用。如果形参是引用类型，那么它将绑定到对应的实参中，我们成为传引用。否则，将会把实参的值拷贝后赋值给形参，我们成为

python学习笔记：三、函数

这是第三篇python学习笔记，我们即将要学习python的函数。内容主要包括两个部分，函数的声明和函数的调用。函数声明和调用比如我们要声明一个“吃”的函数，语法如下：def eat(): return "eat something"print(eat())上面是一个没有参数的函数，做的事情很简单，声明一个函数，然后返回一个字符串。接下来要增加一个参数了。def ead(food): return "eat %s" % foodprint(eat('fruit'))可以看到，上面声明了一个带有一个参数的函数，当然可以声明带两个，三个等。这些都是固定的，那么如果要声明一个不固定参数的

Go语言的 make 和 new

new 和 make 是两个内置函数，主要用来创建并分配类型的内存。在我们定义变量的时候，可能会觉得有点迷惑，不知道应该使用哪个函数来声明变量，其实他们的规则很简单，new 只分配内存，make 只能用于 slice、map 和 channel 的初始化。下面我们就来具体介绍一下new在Go语言中，new 函数描述如下：从上面的代码可以看出，new 函数只接受一个参数，这个参数是一个类型，并且返回一个指向该类型内存地址的指针。同时 new 函数会把分配的内存置为零，也就是类型的零值。【示例】使用 new 函数为变量分配内存空间。当然，new 函数不仅仅能够为系统默认的数据类型，分配空间，自定义

signal函数详解

signal作用是为信号注册一个处理器。这里的“信号”是软中断信号，这种信号来源主要有三种：程序错误：比如除0，非法内存访问。外部信号：终端Ctrl-C产生的SIGINT信号，定时器产生的SIGALERM。显示请求：kill函数发送的任意信号。当kill一个进程的时候，默认会发送SIGTERM信号，此时这个信号只有默认处理操作（SIG_DFL），直接中断进程执行。如果此时该进程正在执行一个任务，直接终止该进程会导致任务没有完成。这个时候为SIGTERM信号注册一个信号处理函数就十分有必要。介绍参数sig要设置信号处理函数的信号。它可以是实现定义值或下例值之一：SIGABRTSIGFPESIGI

计算机语言学习指南

为什么C++模板不支持分离式编译

前言最近编译C++代码时出现链接失败信息，类似下图：图一初见这个错误有些令人费解，不过经过一番分析，发现原因还是清晰的，和大家一起分享一下。图一中使用的tpl.h代码如下：tpl.cpp代码如下：main.cpp代码如下：我一直习惯把模板实现写在头文件中，因此从未遇见这种错误。这次偶然将模板声明和实现分离，出现了链接错误。这引发了我一些思考，为什么模板不支持分离式编译？模板的编译为了搞清楚模板是怎么编译的，这里以上述tpl.cpp中的compare模板函数为例。tpl.h中声明了一个模板函数并且在tpl.cpp中实现这个模板函数。现在我们编译tpl.cpp，生成的汇编代码如下：图二可以看出，一

C++ any容器的介绍与简易实现

一、any容器是什么？1、any“不是”模板类，any是一种很特殊的容器。2、any只能容纳一个元素，但这个元素可以是任意的类型，可以是基本数据类型（int、double、string、标准容器或者任何自定义类型）。3、一种动态（类型检查只发生在运行时）语言特性的数据结构。4、C++17引入，需要RIIT支持，VS默认是没有支持C++17的，需要自己修改设置，如果不能使用any，请修改标准。二、any类摘要C++typeid关键字详解:三、any类用法注意：any的析构函数删除内部holder对象。如果类型是指针，any并不会对指针执行delete操作，所有any保存原始指针对造成内存泄漏。完

c++ 标准库二分查找

C++标准库中的二分查找可以通过std::lower_bound和std::upper_bound函数实现。这两个函数都在<algorithm>头文件中定义，并接受一个排序的范围（例如，std::vector，std::deque，std::array等）以及一个要查找的值。

std::lower_bound返回指向在范围中第一个不小于（即大于或等于）给定值的元素的迭代器。std::upper_bound则返回指向在范围中第一个大于给定值的元素的迭代器。

下面是一个使用std::lower_bound进行二分查找的例子：

#include <iostream>
#include <vector>
#include <algorithm>

int main() {
    std::vector<int> v = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};

    int target = 6;

    auto it = std::lower_bound(v.begin(), v.end(), target);

    if (it != v.end() && *it == target) {
        std::cout << "Found " << target << " at position " << std::distance(v.begin(), it) << std::endl;
    } else {
        std::cout << target << " not found" << std::endl;
    }

    return 0;
}

在这个例子中，我们首先定义了一个排序的std::vector，然后定义了一个目标值target。我们使用std::lower_bound查找target，然后检查返回的迭代器是否指向target。如果是，我们就打印出target在vector中的位置。否则，我们打印出target未找到的消息。

如果你想查找的是范围中是否包含特定的值，并且不关心具体的位置，你可以将std::lower_bound和std::upper_bound的结果进行比较。如果它们相同，那么范围中不包含该值。否则，范围中包含该值。

if (std::lower_bound(v.begin(), v.end(), target) != std::upper_bound(v.begin(), v.end(), target)) {
    std::cout << target << " found in the range" << std::endl;
} else {
    std::cout << target << " not found in the range" << std::endl;
}

请注意，二分查找要求输入范围必须是排序的。如果输入范围未排序，那么结果将是未定义的。

你可能还喜欢下面这些文章

命令行下的mongo初试

从连接mongo开始，熟悉一下命令行下面的mongo使用连接普通连接mongo mongodb://ip:port查看数据库show dbs选择或者创建数据库use mydb创建一个集合比如创建一个mycollection的集合db.createCollection('mycollection')显示数据库中所有的集合show collections向集合中写入数据假设我们创建了一个mycollection集合，实际上当我们没有创建mycollection集合的时候，执行下面的命令mongo会自动创建一个mycollection集合db.mycollection.insert({"foo",'

记一次PHP7中正则匹配失败，原因为PREG_JIT_STACKLIMIT_ERROR

最近弄了一台机器，安装php7，性能很棒！但是在运行中发现之前的程序运行有些异常，有些正则匹配不到了，开始怀疑是正则表达式的问题，一番查找发现php7并没有对正则进行改动。接下来就是一番痛苦的查找bug，我甚至写了一个非正则的函数来替换原来的正则匹配，不过太消耗cpu而放弃了。还是继续找bug，打印出正则的错误信息echo array_flip(get_defined_constants(true));出现了 PREG_JIT_STACKLIMIT_ERROR官方给出的提示是： (自 PHP 7.0.0 起)当 PCRE 函数因 JIT 栈空间限制而失败， preg_last_error(

c++ vector取最后一个元素

在C++中，你可以使用的成员函数来获取最后一个元素。这个函数返回对向量中最后一个元素的引用。以下是一个简单的示例：在这个例子中，我们创建了一个包含五个整数的。然后，我们使用函数获取最后一个元素，并将其存储在变量中。最后，我们打印出这个元素。请注意，如果向量是空的（即，不包含任何元素），调用函数将导致未定义行为。因此，在调用之前，最好先检查向量是否为空，这可以通过调用成员函数来完成。

mysq常用函数大全

很少用到，但是有时候又必须用到，这里收集一下mysql的常用函数一、数学函数ABS(x) 返回x的绝对值BIN(x) 返回x的二进制（OCT返回八进制，HEX返回十六进制）CEILING(x) 返回大于x的最小整数值EXP(x) 返回值e（自然对数的底）的x次方FLOOR(x) 返回小于x的最大整数值GREATEST(x1,x2,...,xn)返回集合中最大的值LEAST(x1,x2,...,xn) 返回集合中最小的值LN(x) 返回x的自然对数LOG(x,y)返回x的以y为底的对数MOD(x,y)

C++ 判断 char* 是否相等

在C++中，是一个指向字符的指针，通常用于表示C风格的字符串。判断两个指针是否相等，需考虑两个方面：判断指针本身的地址是否相等：可以通过直接使用或操作符来实现。和指向不同的地址（尽管它们的内容相同），而和指向相同的地址。2. 判断指针指向的字符串内容是否相等：需要使用函数，它是C标准库中的一部分，在C++中可用。函数用于比较、和的内容。如果内容相同，返回

C++实现python字符串的endswith方法

php print 这个坑，遇到连接符从右往左执行

在使用php的时候，我很少用到print这个函数，哦，不对，这是一个语言结构，而并非日函数！看一段代码

C++入门：三、函数

Go入门：三、函数的声明和调用

C++动态内存管理

C++中，动态内存管理是通过一对运算符来完成：new 和 delete。new操作符在内存中为对象分配空间并返回一个指向该对象的指针，delete接收一个动态对象的指针，销毁该对象，并释放与之相关的内存。手动管理内存看起来只有这两个操作，似乎很轻松，但实际上这是一件非常繁琐的事情，分配了内存但没有释放内存的场景发生的概率太大了！回想一下，你有多少次打开抽屉却没关上，拿出来的护肤品擦完脸之后却忘了放回去，吃完饭却忘了洗碗。类似这种没有收尾的事情我做的太多了。（以上这些都是在实际生活中我爱人批评我的点）我连这种明面上的事情都能忘记收尾，何况分配内存！所以为了世界和平，我放弃了手动管理内存。好在C+

C++字符串拼接

在C++中，字符串拼接可以使用多种方法，下面是一些常用的方法：

使用 `+` 运算符

C++中的 std::string 类型支持 + 运算符来进行字符串拼接。

#include <iostream>
#include <string>

int main() {
    std::string str1 = "Hello, ";
    std::string str2 = "World!";

    // 使用 + 运算符拼接字符串
    std::string str3 = str1 + str2;

    std::cout << str3 << std::endl; // 输出 "Hello, World!"

    return 0;
}

使用 `append` 成员函数

std::string 类提供了 append 成员函数，它可以用来拼接字符串。

#include <iostream>
#include <string>

int main() {
    std::string str1 = "Hello, ";
    std::string str2 = "World!";

    // 使用 append 成员函数拼接字符串
    str1.append(str2);

    std::cout << str1 << std::endl; // 输出 "Hello, World!"

    return 0;
}

使用 `+=` 运算符

std::string 也支持 += 运算符来进行字符串拼接。

#include <iostream>
#include <string>

int main() {
    std::string str = "Hello";

    // 使用 += 运算符拼接字符串
    str += ", World!";

    std::cout << str << std::endl; // 输出 "Hello, World!"

    return 0;
}

使用 C 风格的字符串拼接

虽然不推荐使用C风格的字符串拼接（因为它可能会导致缓冲区溢出），但你还是可以在C++中这样做。在这种情况下，你需要确保目标缓冲区有足够的空间来存储拼接后的字符串。

#include <iostream>
#include <cstring>

int main() {
    char str1[50] = "Hello, ";
    const char* str2 = "World!";

    // 确保str1有足够的空间来存储拼接后的字符串
    if (strlen(str1) + strlen(str2) < sizeof(str1)) {
        strcat(str1, str2);
    }

    std::cout << str1 << std::endl; // 输出 "Hello, World!"

    return 0;
}

在这个例子中，strcat 函数被用来拼接两个C风格的字符串。注意，在使用 strcat 之前，我们检查了 str1 是否有足够的空间来存储拼接后的字符串，以防止缓冲区溢出。

使用 `std::ostringstream`

对于更复杂的字符串拼接，特别是涉及到多个变量和格式化的输出时，可以使用 std::ostringstream。

#include <iostream>
#include <sstream>
#include <string>

int main() {
    int number = 42;
    std::string text = "The answer is ";

    // 使用 ostringstream 进行字符串拼接
    std::ostringstream oss;
    oss << text << number << "!";

    std::string result = oss.str();

    std::cout << result << std::endl; // 输出 "The answer is 42!"

    return 0;
}

在这个例子中，std::ostringstream 被用来构建一个格式化的字符串，其中包含了文本和一个整数值。oss.str() 方法被用来获取拼接后的字符串。

性能问题

在拼接字符串时，性能最好的方法通常取决于拼接操作的性质和上下文。以下是对之前提到的几种方法的性能考虑：

使用 + 运算符和 += 运算符：
对于少量的字符串拼接，使用 + 或 += 运算符通常是可行的，并且它们的性能差异不大。然而，当需要拼接大量的字符串时，这种方法可能会导致性能下降，因为它涉及到内存分配和复制操作。
使用 append 成员函数：
append 方法通常比 += 运算符更高效，因为它避免了额外的复制操作。当你需要在一个字符串上多次追加内容时，使用 append 可能是更好的选择。
使用 std::stringstream：
std::stringstream 适合于构建复杂的字符串，尤其是当涉及到格式化输出时。然而，对于简单的字符串拼接，使用 std::stringstream 可能比直接使用 + 或 append 更慢，因为它涉及到更多的运行时开销。
使用原始字符串字面值（C++11及更高版本）：
原始字符串字面值主要用于包含特殊字符的字符串，而不是用于性能优化。它们对于拼接包含转义字符的字符串（如正则表达式）很有用，但对性能的影响微不足道。
使用第三方库：
第三方库可能提供高效的字符串处理功能，但这也取决于库的具体实现。一些库可能使用特殊的数据结构和算法来优化字符串拼接的性能。然而，使用第三方库也会增加代码的复杂性和依赖性。

总的来说，对于简单的字符串拼接，使用 append 方法可能是性能最优的选择。对于更复杂的字符串构建，如果涉及到大量的拼接操作，可能需要考虑使用更高效的数据结构或算法，或者考虑使用专门设计用于字符串处理的第三方库。

值得注意的是，性能优化通常是在确定存在性能瓶颈后才进行的。在大多数情况下，直接使用 +、+= 或 append 进行字符串拼接已经足够快，并且易于理解和实现。如果你发现字符串拼接成为性能瓶颈，建议通过性能测试工具（如gprof、Valgrind等）来测量不同方法的实际性能，并根据具体的应用场景和需求来选择最合适的方法。

你可能还喜欢下面这些文章

Go入门：六、常用标准库

这是我的Go学习的第六篇笔记，也是Go入门的最后一篇笔记。在大多数语言中，了解了变量和数据类型，流程控制，函数，面向对象，再加上标准库，就可以用这门语言去写一些项目了。首先让我想想，在工作中通常会用语言频繁处理什么问题或者处理什么数据？最常见的应该是各种字符串操作，日期和时间，读写文件、socket等IO相关的操作！字符串处理 — StringsString提供了一组处理字符串的操作，常用的有：判断一个字符串是否在另一个字符串中分割字符串为[]string和组合[]string为一个字符串字符串替换...太多了，就不一一列举了，这里列出一些常用的字符串操作。字符串判断字符串分割与合并字符串转换

rapidjson从字符串解析json

在RapidJSON中，要从字符串解析JSON，你可以使用类的方法。下面是一个简单的例子，展示了如何使用RapidJSON从一个JSON字符串中解析数据：在这个例子中，我们首先定义了一个包含JSON数据的字符串。然后，我们创建了一个对象，并使用方法将JSON字符串解析到这个对象中。解析完成后，我们检查是否有解析错误。如果没有错误，我们就可以通过键（例如"name"、"age"、"city"）来访问JSON对象中的各个成员，并使用、等方法来检查成员的类型，并使用、等方法来获取成员的值。最后，我们还展示了如何将解析后的对象转换回JSON字

bash教程：一、变量，函数，控制流程

变量的定义和使用变量的定义bash变量定义很简单。如下：a="hello"左边是变量名，右边是变量值。bash是弱类型，因此不需要给a加上类型。注意，等号两边不能有空格比如 a = "hello"，这是错误的。变量使用变量使用需要在定义的变量名之前加上$，比如我们打印之前定义的aecho $a特殊变量后面再说，现在仅仅是最基础的，能够让自己写出一个完整的脚本就行。流程控制流程控制则是编写程序必备的过程，比如顺序，循环，条件，分支等等。在其他类C语言中有if...else,for,while,do...while,switch，那么在bash里面，这些应该怎么写呢。if...else结构a=0

python rsplit

在Python中，是字符串（str）对象的一个方法，用于从字符串的末尾（右侧）开始分割字符串。这个方法与方法相似，但方向相反。方法接受一个分隔符（默认为所有空白字符）和一个最大分割次数作为参数，并返回分割后的子字符串列表。下面是方法的基本语法：：分隔符，用于指定如何分割字符串。如果不指定分隔符，则默认为所有的空白字符（包括空格、换行符、制表符等）。：可选参数，指定最大分割次数。如果指定了，则分割不会超过这个指定的次数，并且结果列表的长度最多为。如果参数被省略或者为 -1，则分割会进行到字符串的末尾。下面是一些使用方法的例子：注意：如果参数为空字符串，则会

C++ 判断 char* 是否相等

看看php的boolean都有哪些，以及其有趣的用法

C++实现python字符串的endswith方法

mysq常用函数大全

python教程（一）：变量和数据类型

python的基本数据类型有整型，浮点型，字符串，布尔，列表，元组，字典，集合。它们占用内存和定义方式如下表：类型占用内存如何定义整型(int)动态长度>=24字节a = 1浮点型(float)动态长度>=24字节a = 1.0字符串(string)动态长度，>=37字节，增加一个字符加1字节a = 'str'布尔(boolean)24字节a = True列表(list)动态长度，>=72字节a = []元组(tupe)动态长度，>=56字节a = ()集合(set)动态长度，>=232字节a = set([])占用的内存通过sys.getsizeof()获

php运算符的优先级

python中[:-1]是什么意思

在 Python 中，[:-1] 是一个列表或字符串的切片操作，用于获取从开始到倒数第二个元素（或字符）的子序列。

对于列表：

lst = [1, 2, 3, 4, 5]
print(lst[:-1])  # 输出: [1, 2, 3, 4]

对于字符串：

s = "hello"
print(s[:-1])  # 输出: "hell"

这里的关键是切片操作中的 : 后面的 -1，它表示从末尾开始计数的第一个元素之前的所有元素。具体来说，-1 是最后一个元素，-2 是倒数第二个元素，依此类推。

因此，lst[:-1] 或 s[:-1] 都会返回从开始到倒数第二个元素的子序列。

你可能还喜欢下面这些文章

c++ vector取最后一个元素

python rsplit

C++字符串拼接

在C++中，字符串拼接可以使用多种方法，下面是一些常用的方法：使用运算符C++中的类型支持运算符来进行字符串拼接。使用成员函数类提供了成员函数，它可以用来拼接字符串。使用运算符也支持运算符来进行字符串拼接。使用 C 风格的字符串拼接虽然不推荐使用C风格的字符串拼接（因为它可能会导致缓冲区溢出），但你还是可以在C++中这样做。在这种情况下，你需要确保目标缓冲区有足够的空间来存储拼接后的字符串。在这个例子中，函数被用来拼接两个C风格的字符串。注意，在使用之前，我们检查了是否有足够的空间来存储拼接后的字符串，以防止缓冲区溢出。使用对于更复杂的字符串拼接，特

std::endl为什么导致程序变慢

python教程（一）：变量和数据类型

rapidjson从字符串解析json

php print 这个坑，遇到连接符从右往左执行

在使用php的时候，我很少用到print这个函数，哦，不对，这是一个语言结构，而并非日函数！看一段代码

Go入门：六、常用标准库

python学习笔记：二、流程控制

mysq常用函数大全

python rsplit

在Python中，rsplit() 是字符串（str）对象的一个方法，用于从字符串的末尾（右侧）开始分割字符串。这个方法与 split() 方法相似，但方向相反。rsplit() 方法接受一个分隔符（默认为所有空白字符）和一个最大分割次数作为参数，并返回分割后的子字符串列表。

下面是 rsplit() 方法的基本语法：

str.rsplit([sep[, maxsplit]])

sep：分隔符，用于指定如何分割字符串。如果不指定分隔符，则默认为所有的空白字符（包括空格、换行符 \n、制表符 \t 等）。
maxsplit：可选参数，指定最大分割次数。如果指定了 maxsplit，则分割不会超过这个指定的次数，并且结果列表的长度最多为 maxsplit + 1。

如果 maxsplit 参数被省略或者为 -1，则分割会进行到字符串的末尾。

下面是一些使用 rsplit() 方法的例子：

# 使用默认的空白字符作为分隔符
s = "Hello World, this is Python"
result = s.rsplit()
print(result)  # 输出：['Hello', 'World,', 'this', 'is', 'Python']

# 使用逗号作为分隔符，并指定最大分割次数为 2
result = s.rsplit(',', 2)
print(result)  # 输出：['Hello World', 'this', 'is Python']

# 使用空格作为分隔符，并分割整个字符串
result = "Python is fun".rsplit(' ')
print(result)  # 输出：['Python', 'is', 'fun']

注意：如果 sep 参数为空字符串 ''，则 rsplit() 会将字符串视为一个字符列表，并在每个字符之间进行分割。

s = "Python"
result = s.rsplit('', 1)  # 在每个字符之间分割一次
print(result)  # 输出：['P', 'ython']

你可能还喜欢下面这些文章

boost split 用法

是一个用于将字符串按照指定的分隔符分割成多个子串的函数，并将这些子串存储到一个容器中，比如。使用函数需要包含头文件。函数的用法如下：在上面的示例中，我们首先定义了一个以逗号分隔的字符串。然后，我们创建了一个类型的容器，用于存储分割后的子串。接下来，我们调用函数，将按照逗号进行分割，并将结果存储在容器中。最后，我们遍历容器，并输出每个子串。函数有几个参数：第一个参数是存储分割后子串的容器，类型为或其他类似的容器。第二个参数是要分割的字符串。第三个参数是分隔符，可以是一个普通字符或者正则表达式。常见的分隔符有逗号、分号、制表符等。在上面的示例中，我们使用了作为分隔符，表示以逗号为分隔符进行分割。还

nginx日志可以十分方便的看到每一个请求的响应速度，通常我会用awk去分析这些请求耗时。通常nginx的log配置是这样的log_format access_comment '$remote_addr - $remote_user "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" $http_x_forwarded_for ' '$upstream_response_time $request_time';我们记录的日志类似于这样127.0.0.1 - - "POST /get" "M

boost split 用法

boost::split是一个用于将字符串按照指定的分隔符分割成多个子串的函数，并将这些子串存储到一个容器中，比如std::vector<std::string>。使用boost::split函数需要包含头文件<boost/algorithm/string.hpp>。

boost::split函数的用法如下：

#include <boost/algorithm/string.hpp>
#include <vector>
#include <string>

int main() {
    std::string str = "Hello,World,How,Are,You";
    std::vector<std::string> result;

    // 使用逗号作为分隔符
    boost::split(result, str, boost::is_any_of(","));

    // 输出结果
    for (const auto& substr : result) {
        std::cout << substr << std::endl;
    }

    return 0;
}

在上面的示例中，我们首先定义了一个以逗号分隔的字符串str。然后，我们创建了一个std::vector<std::string>类型的容器result，用于存储分割后的子串。接下来，我们调用boost::split函数，将str按照逗号进行分割，并将结果存储在result容器中。最后，我们遍历result容器，并输出每个子串。

boost::split函数有几个参数：

第一个参数是存储分割后子串的容器，类型为std::vector<std::string>或其他类似的容器。
第二个参数是要分割的字符串。
第三个参数是分隔符，可以是一个普通字符或者正则表达式。常见的分隔符有逗号、分号、制表符等。在上面的示例中，我们使用了boost::is_any_of(",")作为分隔符，表示以逗号为分隔符进行分割。
还有一个可选的参数是token_compress_mode_type，用于指定分词模式。默认为不压缩，即相邻两个分隔符之间没有任何字符时，不会产生空白的子串。如果设置为boost::token_compress_on，则相邻两个分隔符之间不管有无字符都会被视为一个分隔符；如果设置为boost::token_compress_off，则相邻两个分隔符之间只要有任意一个字符就会被视为两个不同的子串。

希望这个解释能够帮助你理解boost::split的用法。

你可能还喜欢下面这些文章

python rsplit

linux awk命令分析你的文本或日志，awk命令用法

简介awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk，未作特别说明，一般指gawk，gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言： AWK 程序设计语言，三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您

python学习笔记：三、函数

C++实现python字符串的endswith方法

当我们在容器里面安装了一些软件或者修改一些设置之后，我们希望能把修改同步到相关的镜像，下次用这个镜像生成容器的时候，可以略过搭建环境这一步了。比如我现在有一个容器叫centos进入容器安装一些软件之后，通过命令将我们的修改保存的新的镜像。上面的镜像名称我加了一个标签。

awk分析nginx日志中的网页响应时间

mysql varchar类型探秘

mysql中varchar能够存储可变长度的字符串。过去我做的诸多业务中，一般存储短字符串的需求，都会使用varchar类型，并且定义长度为255，也就是varchar(255)。不过为了探究varchar这种类型到底是怎么存储的，它的最大长度能达到多少，我决定区翻一下mysql文档学习一下。varchar怎么存储经过一番了解，varchar最大能存储的长度为65535字节。存储字符串的时候，会将字符串的长度存在首部，接着才是内容。当varchar存储的字符个数小于或等于255的时候，首部需要一个字节来记录字符的个数。当内容大于255的字符的时候，首部需要2个自己来保存长度。varchar能存

rapidjson从字符串解析json

在RapidJSON中，要从字符串解析JSON，你可以使用Document类的Parse方法。下面是一个简单的例子，展示了如何使用RapidJSON从一个JSON字符串中解析数据：

#include "rapidjson/document.h"
#include "rapidjson/writer.h"
#include "rapidjson/stringbuffer.h"
#include <iostream>

int main() {
    // JSON字符串
    const char* jsonString = "{\"name\":\"John\",\"age\":30,\"city\":\"New York\"}";

    // 创建一个RapidJSON的Document对象
    rapidjson::Document document;

    // 解析JSON字符串
    document.Parse(jsonString);

    // 检查解析是否成功
    if (document.HasParseError()) {
        std::cerr << "Error parsing JSON: " << document.GetParseError() << std::endl;
        return 1;
    }

    // 访问解析后的JSON数据
    if (document.HasMember("name") && document["name"].IsString()) {
        std::cout << "Name: " << document["name"].GetString() << std::endl;
    }

    if (document.HasMember("age") && document["age"].IsInt()) {
        std::cout << "Age: " << document["age"].GetInt() << std::endl;
    }

    if (document.HasMember("city") && document["city"].IsString()) {
        std::cout << "City: " << document["city"].GetString() << std::endl;
    }

    // 如果需要，也可以将解析后的JSON数据转换回字符串
    rapidjson::StringBuffer buffer;
    rapidjson::Writer<rapidjson::StringBuffer> writer(buffer);
    document.Accept(writer);
    std::cout << "Parsed JSON string: " << buffer.GetString() << std::endl;

    return 0;
}

在这个例子中，我们首先定义了一个包含JSON数据的字符串jsonString。然后，我们创建了一个rapidjson::Document对象，并使用Parse方法将JSON字符串解析到这个对象中。

解析完成后，我们检查是否有解析错误。如果没有错误，我们就可以通过键（例如"name"、"age"、"city"）来访问JSON对象中的各个成员，并使用IsString、IsInt等方法来检查成员的类型，并使用GetString、GetInt等方法来获取成员的值。

最后，我们还展示了如何将解析后的Document对象转换回JSON字符串，以便输出或进一步处理。这可以通过创建一个rapidjson::StringBuffer对象和一个rapidjson::Writer对象来完成，然后调用Document的Accept方法。

你可能还喜欢下面这些文章

C++实现python字符串的endswith方法

C++ 判断 char* 是否相等

C++动态内存管理

Shell中的条件判断语句if的用法

查看varnish统计信息命令：varnishstat

varnishstat是一个查看当前varnish实例的实时运行状态信息。命令以及参数如下：varnishstat 以下选项可用： -1不再显示不断更新的显示，而是将统计信息打印到stdout。-f <glob>Field inclusion glob. Use backslash to escape characters. If the argument starts with '^' it is used as an exclusion glob. Multiple -f arguments may be given, and they will be ap

C++实现python字符串的endswith方法

可以使用std::string的find_last_of()或rfind()方法配合比较运算符来模拟endswith()方法的功能。

下面是一个示例函数，它检查一个字符串是否以另一个字符串结束：

#include <string>

bool endsWith(const std::string& str, const std::string& suffix) {
return str.size() >= suffix.size() &&
str.substr(str.size() - suffix.size()) == suffix;
}

int main() {
std::string s = "Hello, World!";
std::string suffix = "World!";
if (endsWith(s, suffix)) {
std::cout << s << " ends with " << suffix << std::endl;
} else {
std::cout << s << " does not end with " << suffix << std::endl;
}
return 0;
}

在这个示例中，endsWith()函数接受两个std::string参数：str和suffix。函数首先检查str的长度是否大于或等于suffix的长度。如果不是，那么str显然不能以suffix结束，函数返回false。否则，函数使用substr()方法从str的末尾提取与suffix长度相同的子字符串，并将其与suffix进行比较。如果它们相等，那么str以suffix结束，函数返回true。否则，函数返回false。

请注意，这个函数是区分大小写的。如果你想要一个不区分大小写的版本，你可以在比较之前使用std::transform()和tolower()函数将str和suffix转换为小写。

#include <algorithm>
#include <cctype>

bool endsWithIgnoreCase(const std::string& str, const std::string& suffix) {
std::string lowerStr = str;
std::string lowerSuffix = suffix;
std::transform(lowerStr.begin(), lowerStr.end(), lowerStr.begin(), ::tolower);
std::transform(lowerSuffix.begin(), lowerSuffix.end(), lowerSuffix.begin(), ::tolower);
return endsWith(lowerStr, lowerSuffix);
}

在这个版本中，endsWithIgnoreCase()函数首先使用std::transform()和tolower()函数将str和suffix转换为小写。然后，它调用endsWith()函数来检查转换后的字符串是否以suffix结束。

你可能还喜欢下面这些文章

php print 这个坑，遇到连接符从右往左执行

在使用php的时候，我很少用到print这个函数，哦，不对，这是一个语言结构，而并非日函数！看一段代码

bash教程：一、变量，函数，控制流程

还能这样？把 Python 自动翻译成 C++

一、问题背景

随着深度学习的广泛应用，在搜索引擎/推荐系统/机器视觉等业务系统中，越来越多的深度学习模型部署到线上服务。

机器学习模型在离线训练时，一般要将输入的数据做特征工程预处理，再输入模型在 TensorFlow PyTorch 等框架上做训练。

1.常见的特征工程逻辑

常见的特征工程逻辑有：

分箱/分桶离散化
log/exp 对数/幂等 math numpy 常见数学运算
特征缩放/归一化/截断
交叉特征生成
分词匹配程度计算
字符串分隔匹配判断 tong
缺省值填充等
数据平滑
onehot 编码，hash 编码等

这些特征工程代码，当然一般使用深度学习最主要的语言 python 实现。

二、业务痛点

离线训练完成，模型上线部署后，同样要用 C++ 重新实现这些 python 的特征工程逻辑代码。

我们发现，“用 C++ 重新实现” 这个步骤，给实际业务带来了大量的问题：

繁琐，费时费力，极容易出现 python 和 C++ 代码不一致
不一致会直接影响模型在线上的效果，导致大盘业务指标不如预期，产生各种 bad case
不一致难以发现，无法测试，无法监控，经常要靠用户投诉反馈，甚至大盘数据异常才能发现

1. 业界方案

针对这些问题，我调研了这些业界方案：

《推荐系统中模型训练及使用流程的标准化》
https://www.infoq.cn/article/2E6LCqb1GeqFRAjkkjX3

《自主研发、不断总结经验，美团搜索推荐机器学习平台》
https://cloud.tencent.com/developer/article/1357309

《京东电商推荐系统实践》
https://www.infoq.cn/article/1OkKmb_gEYNR3YqC9RcW

“模型线上线下一致性问题对于模型效果非常重要，我们使用特征日志来实时记录特征，保证特征的一致性。这样离线处理的时候会把实时的用户反馈，和特征日志做一个结合生成训练样本，然后更新到模型训练平台上，平台更新之后在推送到线上，这样整个排序形成了一个闭环。”

总结起来，有几种思路：

在线特征存储起来给离线用
在线 C++ 代码编译成 so 导出给离线用
根据一份配置生成离线和在线代码
提取公共代码，加强代码复用，等软件工程手段，减少不一致

2. 自动翻译方案

(1). 已有方案的缺点

但这些思路都有各种缺点：

所有在线请求的所有特征，这个存储量数据量很大
算法改代码需要等待后台开发，降低了算法同学的工作效率
特征处理代码的复杂度转移到配置文件中，不一定能充分表达，而且配置格式增加学习成本
就这边真实离线特征处理代码来看，大部分代码都无法抽取出公共代码做复用。

(2). 翻译器

回到问题出发点考虑，显而易见，这个问题归根结底就是需要一个 “ python 到 c++ 的翻译器 ” 。

那其实 “翻译器 Transpiler ” ，和编译器解释器类似，也是个古老的热门话题了，比如 WebAssembly, CoffeeScript ，Babel ,
Google Closure Compiler，f2c

于是一番搜索，发现 python 到 C++ 的翻译器也不少，其中 Pythran 是新兴比较热门的开源项目。

于是一番尝试后，借助 pythran，我们实现了：

一条命令全自动把 Python 翻译成等价 C++
严格等价保证改写，彻底消除不一致
完全去掉重新实现这块工作量，后台开发成本降到 0 ，彻底解放生产力
算法同学继续使用纯 python，开发效率无影响，无学习成本
并能推广到其他需要 python 改写成后台 C++ 代码的业务场景，解放生产力

三、pythran 的使用流程

(1) 安装

一条命令安装：

pip3 install pythran

(2). 写 Python 代码

下面这个 python demo，是 pythran 官方 demo

import math
import numpy as np

def zero(n, m):
    return [[0]*n for col in range(m)]

#pythran export matrix_multiply(float list list, float list list)
def matrix_multiply(m0, m1):
    new_matrix = zero(len(m0),len(m1[0]))
    for i in range(len(m0)):
        for j in range(len(m1[0])):
            for k in range(len(m1)):
                new_matrix[i][j] += m0[i][k]*m1[k][j]
    return new_matrix

#pythran export arc_distance(float[], float[], float[], float[])
def arc_distance(theta_1, phi_1, theta_2, phi_2):
    """
    Calculates the pairwise arc distance
    between all points in vector a and b.
    """
    temp = (np.sin((theta_2-theta_1)/2)**2
           + np.cos(theta_1)*np.cos(theta_2) * np.sin((phi_2-phi_1)/2)**2)
    distance_matrix = 2 * np.arctan2(np.sqrt(temp), np.sqrt(1-temp))
    return distance_matrix


#pythran export dprod(int list, int list)
def dprod(l0,l1):
    """WoW, generator expression, zip and sum."""
    return sum(x * y for x, y in zip(l0, l1))


#pythran export get_age(int )
def get_age(age):
    if age <= 20:
        age_x = '0_20'
    elif age <= 25:
        age_x = '21_25'
    elif age <= 30:
        age_x = '26_30'
    elif age <= 35:
        age_x = '31_35'
    elif age <= 40:
        age_x = '36_40'
    elif age <= 45:
        age_x = '41_45'
    elif age <= 50:
        age_x = '46_50'
    else:
        age_x = '50+'
    return age_x

(3). Python 转成 C++

一条命令完成翻译

pythran -e demo.py -o  demo.hpp

(4). 写 C++ 代码调用

pythran/pythonic/ 目录下是 python 标准库的 C++ 等价实现，翻译出来的 C++ 代码需要 include 这些头文件

写个 C++ 代码调用

#include "demo.hpp"
#include "pythonic/numpy/random/rand.hpp"
#include <iostream>

using std::cout;
using std::endl;

int main() {
  pythonic::types::list<pythonic::types::list<double>> m0 = {{2.0, 3.0},
                                                             {4.0, 5.0}},
                                                       m1 = {{1.0, 2.0},
                                                             {3.0, 4.0}};
  cout << m0 << "*" << m1 << "n=n"
       << __pythran_demo::matrix_multiply()(m0, m1) << endl
       << endl;

  auto theta_1 = pythonic::numpy::random::rand(3),
       phi_1 = pythonic::numpy::random::rand(3),
       theta_2 = pythonic::numpy::random::rand(3),
       phi_2 = pythonic::numpy::random::rand(3);
  cout << "arc_distance " << theta_1 << "," << phi_1 << "," << theta_2 << ","
       << phi_2 << "n=n"
       << __pythran_demo::arc_distance()(theta_1, phi_1, theta_2, phi_2) << endl
       << endl;

  pythonic::types::list<int> l0 = {2, 3}, l1 = {4, 5};
  cout << "dprod " << l0 << "," << l1 << "n=n"
       << __pythran_demo::dprod()(l0, l1) << endl
       << endl;

  cout << "get_age 30 = " << __pythran_demo::get_age()(30) << endl << endl;

  return 0;
}

(5) 编译运行

g++ -g -std=c++11 main.cpp -fopenmp -march=native -DUSE_XSIMD -I /usr/local/lib/python3.6/site-packages/pythran/ -o pythran_demo

./pythran_demo

四、pythran 的功能与特性

(1) 介绍

按官方定义，Pythran 是一个 AOT (Ahead-Of-Time - 预先编译) 编译器。给科学计算的 python 加注解后，pythran 可以把 python 代码变成接口相同的原生 python 模块，大幅度提升性能。

并且 pythran 也可以利用 OpenMP 多核和 SIMD 指令集。

支持 python 3 和 Python 2.7 。

pythran 的 manual 挺详细：
https://pythran.readthedocs.io/en/latest/MANUAL.html

(2). 功能

pythran 并不支持完整的 python，只支持 python 语言特性的一个子集:

polymorphic functions 多态函数(翻译成 C++ 的泛型模板函数)
lambda
list comprehension 列表推导式
map, reduce 等函数
dictionary, set, list 等数据结构
exceptions 异常
file handling 文件处理
部分 numpy

不支持的功能：

classes 类
polymorphic variables 可变类型变量

(3). 支持的数据类型和函数

pythran export 可以导出函数和全局变量。
支持导出的数据类型，BNF 定义是：

    argument_type = basic_type
                  | (argument_type+)    # this is a tuple
                  | argument_type list    # this is a list
                  | argument_type set    # this is a set
                  | argument_type []+    # this is a ndarray, C-style
                  | argument_type [::]+    # this is a strided ndarray
                  | argument_type [:,...,:]+ # this is a ndarray, Cython style
                  | argument_type [:,...,3]+ # this is a ndarray, some dimension fixed
                  | argument_type:argument_type dict    # this is a dictionary

    basic_type = bool | byte | int | float | str | None | slice
               | uint8 | uint16 | uint32 | uint64 | uintp
               | int8 | int16 | int32 | int64 | intp
               | float32 | float64 | float128
               | complex64 | complex128 | complex256

可以看到基础类型相当全面，支持各种整数，浮点数，字符串，复数

复合类型支持 tuple, list, set, dict, numpy.ndarray 等，

对应 C++ 代码的类型实现在 pythran/pythonic/include/types/ 下面，可以看到比如 dict 实际就是封装了一下 std::unordered_map
https://pythran.readthedocs.io/en/latest/SUPPORT.html
可以看到支持的 python 基础库，其中常用于机器学习的 numpy 支持算比较完善。

五、pythran 的基本原理

和常见的编译器/解释器类似， pythran 的架构是分成 3 层：

python 代码解析成抽象语法树 AST 。用 python 标准库自带的的 ast 模块实现
代码优化。
在 AST 上做优化，有多种 transformation pass，比如 deadcode_elimination 死代码消除，loop_full_unrolling 循环展开等。还有 Function/Module/Node 级别的 Analysis，用来遍历 AST 供 transformation 利用。
后端，实现代码生成。目前有 2 个后端，Cxx / Python， Cxx 后端可以把 AST 转成 C++ 代码（ Python 后端用来调试）。

目前看起来，pythran 还欠缺的：

字符串处理能力欠缺，缺少 str.encode()/str.decode() 对 utf8 的支持
缺少正则表达式 regex 支持

看文档要自己加也不麻烦，看业务需要可以加。

文章来源：腾讯技术工程

你可能还喜欢下面这些文章

代码语法高亮插件整理

语法高亮是文本编辑器用来显示文本的，特别是源代码，根据不同的类别来用不同的颜色和字体显示。这个功能有助于编写结构化的语言，比如编程语言，标记语言，这些语言的语法错误显示是有区别的。语法高亮并不会影响文本自身的意义，而且能很好的符合人们的阅读习惯。语法高亮同时也能帮助开发者很快的找到他们程序中的错误。例如，大部分编辑器会用不同的颜色突出字符串常量。所以，非常容易发现是否遗漏了分隔符，因为相对于其他文本颜色不同。现在有各种各样的语法高亮工具，可以格式化语言，并且根据不同的编程语言进行高亮显示。无论是个 HTML 页面还是 PHP，Ruby，Python 或者是 ASP。这篇文章中，我们会介绍 1

中文分词词性对照表

汉语词性对照表词性编码词性名称注解Ag形语素形容词性语素。形容词代码为 a，语素代码ｇ前面置以A。a形容词取英语形容词 adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码 a和副词代码d并在一起。an名形词具有名词功能的形容词。形容词代码 a和名词代码n并在一起。b区别词取汉字“别”的声母。c连词取英语连词 conjunction的第1个字母。dg副语素副词性语素。副词代码为 d，语素代码ｇ前面置以D。d副词取 adverb的第2个字母，因其第1个字母已用于形容词。e叹词取英语叹词 exclamation的第1个字母。f方位词取汉字“方”g语素绝大多数语素都能作为合成词

如何选择特征

特征工程是数据分析中最耗时间和精力的一部分工作，它不像算法和模型那样是确定的步骤，更多是工程上的经验和权衡。因此没有统一的方法。这里只是对一些常用的方法做一个总结。本文关注于特征选择部分。后面还有两篇会关注于特征表达和特征预处理。1. 特征的来源在做数据分析的时候，特征的来源一般有两块，一块是业务已经整理好各种特征数据，我们需要去找出适合我们问题需要的特征；另一块是我们从业务特征中自己去寻找高级数据特征。我们就针对这两部分来分别讨论。2. 选择合适的特征我们首先看当业务已经整理好各种特征数据时，我们如何去找出适合我们问题需要的特征，此时特征数可能成百上千，哪些才是我们需要的呢？第一

C++ any容器的介绍与简易实现

C++中zlib的crc32和python zlib.crc32结果不一致的解决方案

背景python和c++的代码中均有使用crc32分流的操作，需要保证分流得到的结果一致，那么两个crc32的方法得到的结果需要一致才行。然而实际测试中发现python2中zlib.crc32和c++的zlib中crc32得到的结果却不一致。问题复现python版crc32结果为 -102031187。如下：C++ 版zlib crc32运行结果为：4192936109python版得出的结果是-102031187，而C++版本得出的结果是4192936109。资料查找首先从百度上查看有没有人和我遇到同样的问题，结果发现有。但是回答的结果乱七八糟，没什么参考价值。于是找了找python的文档，

创建自己的composer包之怎样制作composer包

项目做多了之后，可能会慢慢总结出自己的代码库出来，当在新的项目中使用的时候，总不能一直是复制粘贴。这个时候，composer就能派上用场了。一个项目开始，使用composer就能够加载所需要的依赖，非常方便。这个时候，来做一个自己的包吧！使用命名空间composer自动加载需要用到命名空间，因此所有的代码库都需要使用命名空间，如果没有，那就改吧！使用命名空间之后你可能会打开新世界的大门。创建composer.json我假设你已经安装了composer，并且已经会使用了。创建自己的包我们首先需要创建一个composer.json，示例文件如下上面的composer.json有一个比较重要的是au

c语言中的define用法

作为代码中，第一个看到的，极有可能就是define这个东西，称为宏！（define是可以出现在任何地方的，但是我们一般把这个写到最开始）然而，很多时候，初学者有时候可能看不懂她，因此，我的c语言学习的第一篇就写这个啦。define基本用法，简单定义最浅显的，define能用一个有含义的字符来替代一些数字，比如#define PI 3.141592654这样，假如以后要计算圆的周长或者面积，就可以用PI这个字符而不用写3.141592654啦。比如#define PI 3.141592654#include "stdio.h"int main(){ int r = 3; float

一个将网页里面的(图片，链接地址)相对路径转化为绝对路径的php实现方法

抓取网页的时候有时候会需要下载里面的图片或者其他附件，但有的网页里面用的是相对路径，这时候就要转化为绝对路径。 /*** url补全，相对url转化为绝对url* 作用是补全url*/function url2abs($srcurl,$baseurl){ $srcinfo = parse_url($srcurl); //print_r($srcinfo); if(isset($srcinfo)) { return $srcurl; } $baseinfo = parse_url($baseurl); $url = $baseinfo.'://'.$basein

不给以后的你找麻烦，编写单元测试吧

原本我想要写造福后人，请为你的程序编写单元测试吧。突然觉得这样写会不会太高尚了一些，想想还是不给以后的自己找麻烦，编写单元测试比较好。一直都在隐式的做着单元测试你可能没有听过单元测试，或者听过，但没有使用单元测试框架来做单元测试，又或者对单元测试框架不屑一顾等等...（等等，这不是在说我自己嘛）好了，在你没有使用单元测试框架之前，其实你一直在不知不觉中使用单元测试。比如，当你写完了一个方法的时候，你会在下面调用这个方法，然后看看运行的结果，哦，对了，要的就是这个结果。这就是一个单元测试啊！你对这个方法做了一个测试，传n个参数进入，输出一个结果，结果与预期一致，通过；结果与预期不一致，失败，de

php的empty,isset，is_null与！

来说说php的empty，isset，is_null 与!，这几个都是if语句中比较常见的判断逻辑。但是有时候用的很纠结，甚至看别人写的程序里面也很纠结。特地梳理梳理，避免踩坑先来定义一些东西<?php$a;$b=0;$c=array();$d='';$e=null;empty，用了会上瘾这是一个用了会上瘾的语言结构！多好，empty可接受的参数是一个变量，任意类型，哪怕是变量不存在，只要变量被boolean转换之后是false（参考：php的boolean都有哪些），那么empty返回的就是false，并且不会出现警告！等价于不过注意的是，empty里面不能使用表达式（在php<

1. 使用expr命令

2. 使用let命令

3. 使用双括号(( ))

4. 使用bc命令

5. 使用awk命令

使用 + 运算符

使用 append 成员函数

使用 += 运算符

使用 C 风格的字符串拼接

使用 std::ostringstream

性能问题

一、问题背景

1.常见的特征工程逻辑

二、业务痛点

1. 业界方案

2. 自动翻译方案

(1). 已有方案的缺点

(2). 翻译器

三、pythran 的使用流程

(1) 安装

(2). 写 Python 代码

(3). Python 转成 C++

(4). 写 C++ 代码调用

(5) 编译运行

四、pythran 的功能与特性

(1) 介绍

(2). 功能

(3). 支持的数据类型和函数

五、pythran 的基本原理

1. 使用`expr`命令

2. 使用`let`命令

3. 使用双括号`(( ))`

4. 使用`bc`命令

5. 使用`awk`命令

使用 `+` 运算符

使用 `append` 成员函数

使用 `+=` 运算符

使用 `std::ostringstream`