0


Nginx 301重定向分析

参考;

404 - 墨天轮

深度硬核文:Nginx的301重定向处理过程分析 - 知乎

Nginx的301状态码处理逻辑设计

HTTP协议中3xx开头的状态响应码都是表示重定向的响应。根据RFC的定义:

301 Moved Permanently

302 Found

303 See Other

307 Temporary Redirect

301是永久重定向。如果使用Nginx作为HTTP 服务器,那么当用户输入一个不存在的地址之后,基本上会有两种情况,返回404状态码,或者301状态码。404 Not Found不做讨论,只是说下301 Moved Permanently的处理过程。

页面重定向功能会在什么样的情况下被触发?

答案是:Nginx负责设置301 Moved Permanently状态码。但nginx.conf控制Nginx如何处理301 Moved Permanently状态码!换句话说,要不要进行页面重定向,和怎么重定向,完全是用户配置的结果!六种分支的选择完全是根据用户的配置来决定的。

根据源代码,Nginx的算法逻辑设计是分成两个部分的。第一部分是设置状态码,第二部分是对应状态码的实际响应处理。

Nginx和浏览器之间的通讯过程,比如一次正常的HTTP 访问过程,如下图。

从逻辑顺序上来说,Nginx会先设置好状态码,然后根据状态码来构造Response Header和Body,最后发送给浏览器,让浏览器渲染页面内容。

301 Moved Permanently状态码和200 OK状态码的处理过程是一致的。Nginx主动设置301 Moved Permanently状态码只有一种情况,当用户输入了一个url地址,最后的部分是一个文件目录。比如 http://www.test.com/index, Nginx在运行过程中没有找到index这个文件,但发现了index是个目录。于是本次访问的状态码就会被设置成301 Moved Permanently。

但注意!设置成301 Moved Permanently,不一定会导致浏览器重定向。从HTTP定义来说,导致浏览器触发重定向操作是因为浏览器收到了一个Locationresponse header;

让我们来看看Location的定义说明,很明确的说明了Location的作用。

The Location response header indicates the URL to redirect a page to. It only provides a meaning when served with a3xx (redirection) or 201(created) status response.

Nginx在Response Header里写入一个Location之后。浏览器可以根据Location来控制重定向过程。逻辑过程如上图。而且nginx.conf文件中的配置将影响到Location URL的生成方式。

nginx.conf中配置项的作用

nginx.conf文件在哪个环节起作用呢?答案就是设置Location之前。

一般情况下,我们会在nginx.conf中配置absolute_redirect ,server_name_in_redirect和port_in_redirect,以便到达个性化的重定向功能。这三个配置项的作用是很多人明白的,但对于逻辑顺序很少有文章提到。

重定向三配置

absolute_redirect ,server_name_in_redirect和port_in_redirect三个设置项中,根据Nginx的源代码中Response Header处理算法逻辑,Nginx能够控制重定向的关键配置项是:absolute_redirect,在整个Nginx代码中,absolute_redirect在控制在Response Header如何增加Location url。

absolute_redirect设置成On,则生成absolute url作为Location url。absolute_redirect设置成Off,则生成relative url作为 Location url。

absolute url是包含完整信息的url,比如http://www.test.com:8080/index/1.html 这样的URL地址relative url 则省略了服务器名字和端口号,比如 /index/1.html

因为relative url没有端口号,没有Host名字,所以absolute_redirect 设置On的时候,server_name_in_redirect和port_in_redirect两项设置才会起作用。

我花了点时间仔细阅读了Nginx的相关源代码,并画了流程图。

从以上逻辑过程, absolute_redirect,server_name_in_redirect,port_in_redirect 三项配置,共同控制了生成字符串 “Location: http://server_name:port/test/”的结果。

server_name_in_redirect 控制URL中的Server Name,也就是Host使用哪个值,port_in_redirect控制URL中的port是使用哪个值。通过这三个配置项,最终决定了Nginx返回给浏览器的Location内容。

用MindMap来表达就是

备注:header_in.server是nginx源代码中的变量,指向用户输入的url的服务器名字部分。根据以上脑图,我们可以很清楚的看到,最终我们只有六个分支结果。

案例分析

依据上面的分析,我们具体举个非常疑难的例子,看看如何解决问题。

1,问题:http://www.test.com:888/index被错误的重定向至http://www.test.com/index/这种情况多见于使用NAT做端口映射,或者是用容器来运行Nginx。内部服务器或者容器中nginx监听的是80端口号

而我们的期望答案是:http://www.test.com:888/index重定向至http://www.test.com:888/index/

2,分析和解答:假设Nginx使用默认设置

absolute_redirect:on

server_name_in_redirect:off

port_in_redirect :on

这个问题看似丢失了端口号,实际上是暴露了nginx的内部端口号。这种情况下,port_in_redirect不管设置成on或者off都不会起作用。

port_in_redirect = on,nginx监听80端口,默认80端口号不需要在url中设置【3号分支】,结果是http://www.test.com/index/

port_in_redirect = off,nginx不设置port数据【5号分支】,结果还是http://www.test.com/index/

我们会发现,在这里无论怎么调整server_name_in_redirect【1,2号分支】和port_in_redirect的on,off都是无效的。因为1号至5号分支,都没有包含这种情况。解决问题的方向错了,解决方案当然就是错误的。

实际的解决方案有两个: rewrite【分支以外】 absolute_redirect:off【六号分支】 rewrite是通过脚本来控制nginx的运行过程,不在上面的配置分支中。具体操作可以参考下面的设置

rewrite [^/]$ $scheme://$http_host$uri/ permanent;备注:rewrite的操作方式依据不同的目录结构,可能略有不同,请根据实际情况来设置。

absolute_redirect:off,就是六号分支absolute_redirect:off之后,Nginx返回Location:/index/,但这个方式也许会带来其他问题。

absolute_redirect

*1. *设置absolute_redirect

1) absolute_redirect为off。

server { server_name sample_test.xyz sample_preview.xyz; server_name_in_redirect off; listen 9098;  port_in_redirect on;  absolute_redirect off;  root html/; }

当前absolute_redirect指令设置的是off,此时头部的Location部分是不会出现协议、主机名还有端口。


2)absolute_redirect为on。

server { server_name sample_test.xyz sample_preview.xyz;  server_name_in_redirect off;  listen 9098;  port_in_redirect on;  absolute_redirect on;  root html/; }

当absolute_redirect指令设置为on,头部的Location部分则出现协议、主机名还有还有端口。

*2. 设置server_name_in_redirect*

1) server_name_in_redirect 为off。

server { server_name sample_test.xyz sample_preview.xyz;  server_name_in_redirect off;  listen 9098;  port_in_redirect on;  absolute_redirect on;  root html/; }

将server_name_in_redirect指令设置为off,会使用请求头中Host的值。这里杨杨在请求时添加头部信息,可以看到Location中的域名变成了aaa。

2)server_name_in_redirect 为on。

server { server_name sample_test.xyz sample_preview.xyz; server_name_in_redirect on; listen 9098; port_in_redirect  on;absolute_redirect on; root html/;}

将server_name_in_redirect指令设置为on,会location会使用配置文件中的server_name

*3. *设置port_in_redirect
1) port_in_redirect为off。

server { server_name sample_test.xyz sample_preview.xyz;  server_name_in_redirect off;  listen 9098;  port_in_redirect off;  absolute_redirect on;  root html/; }

当port_in_redirect指令的值设置为off,location中就不会展示出访问的端口号。

在前几个例子中,port_in_redirect指令的值为on,此时location中会展示出端口号。

标签: nginx

本文转载自: https://blog.csdn.net/lovelovelovelovelo/article/details/131877464
版权归原作者 CrazyL- 所有, 如有侵权,请联系我们删除。

“Nginx 301重定向分析”的评论:

还没有评论