jq 一个命令行的 JSON 处理器
如何使用 jq
echo '{"foo": "bar"}' | jq .
{
"foo": "bar"
}
获取foo
的值
echo '{"foo": "bar"}' | jq .foo
"bar"
从 JSON 中获取多个字段的值
echo '{"foo": 1, "bar": 2}' | jq '[.foo, .bar]'
[
1,
2
]
使用@tsv
生成制表符分隔值作为输出
echo '{"foo": 1, "bar": 2}{"foo": 3, "bar": 4}' | jq -r '[.foo, .bar] | @tsv'
1 2
3 4
jq 选择字段包含某值的 JSON
echo '{"foo": 1}{"foo":2}' | jq 'select(.foo == 1)'
{
"foo": 1
}
jq 支持的功能
- 数据索引
echo '[1, 2, 3]' | jq '.[0]'
1
- 切片
echo '[1, 2, 3]' | jq '.[0:2]'
[
1,
2
]
- 可以实现 php 的 array_values,获取字典对象的值
echo '{"a": 1, "b": 1}' | jq '.[]'
echo '{"user":"stedolan", "projects": ["jq", "wikiflow"]}' | jq '.user, .projects[]'
- 实现 php 的 array_keys,获取字典对象的 key 名
echo {"abc": 1, "abcd": 2, "Foo": 3} | jq 'keys'
[
"Foo",
"abc",
"abcd"
]
- 数学运算
echo '{"a": 7}' | jq '.a + 1'
实战
分析日志
从日志中获取用户 ID,请求方法,请求路径,IP 等数据,那么使用如下的命令,就可以很快的提取出你所需要的数据了。
grep -oP '{.+}' /tmp/standard-request-2020082800 | jq -r '[.user, .method, .path, .ip] | @tsv'
16239323 GET /api/config 39.10.111.91
18712163 GET /api/room/rankings 183.90.136.182
11230503 GET /api/user/panel 219.192.217.116
19112230 GET /api/user/notification 116.186.136.130
统计了一下,5,006,012 行日志单条命令处理时间大概 7 多钟,大概 11124.47 docs/s
, 速度还是相当可以的,如果使用 split
切分成多个文件,并行处理之后,再合并,这样速度会更快。
real 7m34.540s
user 7m52.144s
sys 0m24.824s
对比测试
为了验证一下 shell 的高效处理,于是我用 Golang 写了一个程序来处理,达到相同的效果,结果让我失望了,竟然 Golang 处理只需要 6 分钟。其实感觉还好吧,毕竟写程序花费的时间会长一些。
代码如下
go build cmd/calc/main.go
time ./main -log /tmp/standard-request-2020082800 > 1.txt
real 5m58.671s
user 5m58.858s
sys 0m24.796s
package main
import (
"bufio"
"encoding/json"
"flag"
"fmt"
"io"
"log"
"os"
"strings"
)
type Info struct {
User string `json:"user"`
IP string `json:"ip"`
Path string `json:"path"`
Method string `json:"method"`
}
var (
logFile string
)
func init() {
flag.StringVar(&logFile, "log", "", "log file path")
flag.Parse()
}
func main() {
if logFile == "" {
log.Fatal("log file is empty")
}
ReadFileContent(logFile)
}
func ReadFileContent(filename string) {
fi, err := os.Open(filename)
if err != nil {
log.Fatal(err)
}
defer fi.Close()
br := bufio.NewReader(fi)
for {
line, err := br.ReadString('\n')
if err != nil {
if err == io.EOF {
break
}
log.Fatal(err)
}
content := line[strings.Index(line, "{"):]
var info Info
err = json.Unmarshal([]byte(content), &info)
if err != nil {
log.Fatal(err)
}
fmt.Println(info.User, "\t", info.IP, "\t", info.Method, "\t", info.Path)
}
}
总结
jq
功能太强大了,可以通过 linux 命令翻阅手册man jq
,查看 jq 的用法,这里就不逐一介绍了,你能想到的都有。- 为什么喜欢用 jq 呢?通常处理文本的量比较大,自己写程序处理可能太慢,而且写程序需要花费不少的时间,所以能用 jq 和其它 linux 命令解决就直接写命令行了。
- 还有用命令行处理特别的酷,代码短小精悍,处理速度快。