一次 Nginx 双斜杠问题排查
背景
前段时间出现了一个请求在测试环境签名成功,在线上环境签名失败的情况,排查原因是线上url
中有双斜杠会被合并成一个传给后端,在测试环境中不会出现。这个就比较神奇了,Nginx 版本完全一样。
确认问题
方式是抓包确认:在线上Nginx
和测试Nginx
抓包,对比
以下例子中218.218.218.218
是线上服务器Nginx
的ip
121.121.121.121
是自己电脑出口ip
10.0.0.1
是线上Nginx
的局域网ip
10.0.0.2
是Java业务机的局域网ip
1. 从自己电脑到线上Nginx的包如下: |
可以看到Nginx
转发到后端Java
这里的时候,/easicare/v1//subCourses/
已经没有两个斜杠了,但是测试环境转到后端的时候是有的,这里就不贴包内容了。
自己在本地测试了很久,发现都不会合并多余的/
,google
了很久也没有答案,只能最后一个方案,debug
一下Nginx
的源码
环境:Mac+Clion
最终跟进了代码:src/http/modules/ngx_http_proxy_module.c
的ngx_http_proxy_create_request
函数
下面这段代码是生成转发给upstream
的http
包// 拷贝'GET '
b->last = ngx_copy(b->last, method.data, method.len);
*b->last++ = ' ';
u->uri.data = b->last;
// 拷贝uri,核心差别就在这里
// 如果unparsed_uri=1,url部分就使用unparsed_uri.data,就是没有合并斜杠的url
// 如果unparsed_uri=0,url部分就使用uri.data,就是合并过斜杠的url
if (plcf->proxy_lengths && ctx->vars.uri.len) {
b->last = ngx_copy(b->last, ctx->vars.uri.data, ctx->vars.uri.len);
} else if (unparsed_uri) {
// 如果unparsed_uri=1,url使用unparsed_uri.data
b->last = ngx_copy(b->last, r->unparsed_uri.data, r->unparsed_uri.len);
} else {
if (r->valid_location) {
b->last = ngx_copy(b->last, ctx->vars.uri.data, ctx->vars.uri.len);
}
if (escape) {
ngx_escape_uri(b->last, r->uri.data + loc_len,
r->uri.len - loc_len, NGX_ESCAPE_URI);
b->last += r->uri.len - loc_len + escape;
} else {
// 如果unparsed_uri=0,url使用uri.data,uri.data是合并过的url
b->last = ngx_copy(b->last, r->uri.data + loc_len,
r->uri.len - loc_len);
}
// 这里是拼接querystring
if (r->args.len > 0) {
*b->last++ = '?';
b->last = ngx_copy(b->last, r->args.data, r->args.len);
}
}
那么unparsed_uri
这个标记位怎么来的?ctx->vars.uri.len == 0
的情况下会置位1
,vars.uri
的值的含义是Nginx配置文件中proxy_pass server
后面那段
比如proxy_pass http://my-tomcat-server;
那么vars.uri
值是NULL
比如proxy_pass http://my-tomcat-server/nimei;
那么vars.uri
值是/nimei
unparsed_uri = 0; |
回过来看这个问题,就很简单了
线上环境配置 |
线上配置server
后面多了/easicare
,会走unparsed_uri=0
的逻辑,会使用合并过/的url,测试环境server
后面是空的,会走unparsed_uri=1
的逻辑,会不合并url
还有一个问题,merge_slashes
这个指令有什么用?merge_slashes这个指令默认是开的,会决定会不会自动合并uri中的/,决定了uri这个基础,会不会有第一步合并这一步
merge_slashes | proxy_pass后无url | 最终转发url是否合并/ |
---|---|---|
on | 有 | 合并了/ |
on | 无 | 没有合并/ |
off | 有 | 没有合并/ |
off | 无 | 没有合并/ |
这个问题看起来表面上只影响了双斜杠的问题,实际上,很多地方都有影响,比如刚刚好,线上又出现了一起问题
请求是: /easicar/v1/subCourses/{subCourseId}/comments/create
因为前端问题{subCourseId},没有用值覆盖它,在线上不正常,在测试环境正常
还是因为那个问题
实验结果如下
1. server 后面有内容的时候 (模拟线上情况) |