0


【Linux】环境变量及相关指令

一、环境变量的基本概念

其实,我们早就听说过环境变量,比如在学习 JAVA / Python 的时候,会在 Windows 上配置环境变量:

环境变量到底是什么呢?
  • 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数
  • 这些参数通常有特殊的用途。如:我们在编写 C/C++ 代码的时候,在链接的时候,我们从来不知道我们所链接的动态静态库在哪里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
  • 环境变量通常具有某些特殊用途,环境变量在系统当中通常具有全局特性。

1、常见环境变量

  • PATH:(当前用户)指定命令的搜索路径
  • HOME:指定用户的主工作目录(即用户登陆到 Linux 系统中时,默认的目录)。
  • SHELL:当前 Shell,它的值通常是** /bin/bash**。
  • HISTSIZE:命令历史记录保存数量。(Centos 6.7 默认是 3000 条)

命令 history 可以查看所有命令历史记录。搭配管道 history | wc -l 可以查看命令历史记录的行数。


2、查看环境变量方法

命令:echo $PATH

PATH 是环境变量的名称,查看指定环境变量。

命令:env

查看系统中所有的环境变量。


3、环境变量:PATH

我们编写的 C/C++ 代码,编译生成的可执行程序,是不是一个命令呢?

是的。

在 Linux 中,任何一个可执行程序具有可执行权限(x),就称之为它是一条命令。

其实我们听过的:程序、命令、指令、可执行程序等等都是一个概念。

既然是同一个概念,那为什么运行 ls 等命令,不用带 ./ 当前路径,而运行我们自己的可执行程序 proc 必须要带 ./proc 当前路径呢?

环境变量 PATH 中保存的是指定命令的搜索路径。

因为 ls 等命令是在系统的特定路径下保存起来的,而 proc 命令没有保存在 PATH 指定的这些路径中,系统执行命令又只会在 PATH 指定的这些路径中搜索,那么系统就找不到我们的 proc 命令,所以就报错了。

那有没有什么办法,可以让可执行程序 proc 不用带 ./ 当前路径就可以直接运行呢?

方法 1:把 proc 拷贝到环境变量 PATH 指定的任一路径下。

方法 2:把 proc 所在路径添加到环境变量 PATH 中。(注意:自己添加的环境变量,系统重启后是不会被保存的)

$ PATH=$PATH:/home/ll/xxx/10

# :冒号是分隔符
# 注意:PATH=/home/ll/xxx/10,不能这样写,必须加上$符号,否则会把PATH中所有内容覆盖掉

运行效果图:

注意:如果我们不幸把环境变量给覆盖掉了,不用担心。环境变量既然是变量,说明它是可以被赋值的,即在用户登录时,通过用户目录下的配置文件赋值的,所以只需要重新登录就好了。

比如:在家目录下的
.bash_profile 文件,这些文件
不建议自己去随意修改:


4、环境变量:HOME

分别在 root 和普通用户下执行 cd ~ 和 pwd 查看家目录,分别是 /root 和 /home/xyl,为什么得到的结果不一样呢?

因为不同用户的家目录中的配置文件不一样,所以不同用户下的环境变量 HOME 也是不一样的。

[root@VM-0-12-centos ~]$ echo $HOME
/root
[xyl@VM-0-12-centos ~]$ echo $HOME # 指定用户的主工作目录
/home/xyl

二、与环境变量相关的命令

  1. echo:显示某个环境变量值。
  2. export:设置一个新的环境变量。
  3. env:显示所有环境变量。
  4. unset:清除环境变量。
  5. set:显示本地定义的 shell 变量和环境变量。

1、通过 C 库函数获取环境变量:getenv

(1)getenv 和 setenv 函数介绍
  • name:环境变量的名称。
  • 返回值:环境变量的内容。
#include <stdlib.h>

char *getenv(const char *name); // 获取环境变量
int setenv(const char *name, const char *value, int overwrite); // 更改或添加环境变量

(2)getenv 使用举例
// proc.c
#include <stdio.h>
#include <stdlib.h> // getenv

int main()
{
    printf("%s\n", getenv("PATH"));
    printf("%s\n", getenv("HOME"));
    printf("%s\n", getenv("SHELL"));
    return 0;
}

运行结果:在 bash 创建的子进程 proc 中成功获取到了环境变量。

结论:

  • 我们在命令行上运行的大部分命令,它们的父进程都是 bash。
  • bash 创建子进程,然后由子进程执行用户输入的命令。

三、环境变量和本地变量

在命令行中,我们通常可以定义两种变量:

  • 环境变量环境变量通常具有全局属性:可以被子进程继承下去)

环境变量实际上是在当前 bash 的上下文中定义的。所以在当前命令行解释器 bash 内可以被访问到,在 bash 创建的子进程内也可以被访问到。


#include <stdio.h>
#include <stdlib.h>

int main()
{
    char* env = getenv("MYENV");
    if(env)
    {
        printf("%s\n", env);
    }
    return 0;
}

直接运行发现没有结果,说明该环境变量根本不存在。

  • 导出环境变量:export MYENV="hello world"
  • 再次运行程序,发现有结果了。说明:环境变量是可以被子进程继承下去的。
  • 本地变量(只能在当前 shell 命令行解释器内被访问,不可以被子进程继承)
[xyl@VM-0-12-centos 10]$ MY_VAL="hello world"  # 定义本地变量(在bash内定义的)

如何查看本地变量呢?

和查看环境变量方式一样:

[ll@VM-0-12-centos 10]$ echo $MY_VAL  # 在当前命令行解释器bash内访问本地变量
hello world
如何证明本地变量不能被子进程继承?
// proc.c
#include <stdio.h>
#include <stdlib.h> // getenv

int main()
{
    printf("%s\n", getenv("MY_VAL"));
    return 0;
}

运行结果:段错误。

分析:

当我们输入 ./proc 后,bash 会创建子进程来执行 proc 程序。但因为本地变量 MY_VAL 只能在当前 bash 内被访问,不能被其子进程继承,所以子进程中的 getenv("MY_VAL") 函数获取不到本地变量 MY_VAL,导致程序报错。

该怎么解决这个问题呢?

可以将本地变量 MY_VAL 设置成环境变量。

[ll@VM-0-12-centos 10]$ exprot MY_VAL  # 把本地变量MY_VAL导出成环境变量

导入成功:

再次运行程序:成功访问到了环境变量 MY_VAL。

上面说到,我们在命令行上运行的大部分命令,都是 bash 创建子进程来执行的,而本地变量不能被子进程继承,那为什么使用 echo 命令,却可以访问本地变量呢?

四、命令行参数

1、main 函数的参数列表

main 函数可以带参数吗?能带几个参数呢?

main 函数可以带参,但大部分都是缺省。

  • argc:命令行参数的个数。
  • argv:字符指针数组(指向各个命令行参数的字符指针所构成的数组)。
int main(int argc, char* argv[]) // 接收命令行参数
{
    for (int i = 0; i < argc; i++)
    {
        printf("argv[%d]: %s\n", i, argv[i]); // 遍历字符指针数组argv
    }
    return 0;
}

运行结果:字符数组中只有一个元素,就是我们输入的命令。

[ll@VM-0-12-centos 10]$ ./proc
argv[0]: ./proc

如果再多输入几个参数,就能观察到如下运行结果:

[ll@VM-0-12-centos 10]$ ./proc agr1 arg2 arg3
argv[0]: ./proc
argv[1]: agr1
argv[2]: arg2
argv[3]: arg3

总结:

实际上我们输入的命令行参数,就是一个个的 C 字符串: "./proc"、"arg1"、"arg2"、"arg3",传给了 main 函数:


2、命令行参数的意义

为什么要存在命令行参数呢?

帮助我们能够给同一个程序,设计出不同的业务功能。

举个小例子,比如我想要实现这样一个计算器: 
  • 如果输入 ./cal,则会提示该程序的正确用法:Usage:./cal -[a|s] x y;
  • 输入 ./cal -a 1 2,cal 程序可以输出 1 + 2 的结果;
  • 输入 ./cal -s 4 2,cal 程序可以输出 4 - 2 的结果。
#include <stdio.h>
#include <stdlib.h> // atoi -- 函数原型:int atoi(const char *nptr); // 将C字符串转换成整数
#include <string.h> // strcmp

// cal命令的用法手册
void Usage(const char* cal)
{
    printf("Usage: %s -[a|s] x y\n", cal);
}

int main(int argc, char* argv[]) // 接收命令行参数
{
    // 输入的参数个数不为4
    if (argc != 4)
    {
        Usage(argv[0]);
        return 1; // 退出程序
    }

    // 保存第3个和第4个参数                                                      
    int x = atoi(argv[2]);
    int y = atoi(argv[3]);
    
    // 根据不同参数,执行不同功能,然后输出结果
    if (strcmp(argv[1], "-a") == 0)
    {                                            
        printf("%d + %d = %d\n", x, y, x + y); 
    }
    else if (strcmp(argv[1], "-s") == 0)
    {
        printf("%d - %d = %d\n", x, y, x - y); 
    }
    else
    {
        Usage(argv[0]);
        return 1; // 退出程序
    }

    return 0;
}

运行结果:

[ll@VM-0-12-centos 10]$ ./cal        # 命令使用手册
Usage: ./cal -[a|s] x y
[ll@VM-0-12-centos 10]$ ./cal -a 1 2 # 实现加法
1 + 2 = 3
[ll@VM-0-12-centos 10]$ ./cal -s 4 2 # 实现减法
4 - 2 = 2

3、总结

命令行参数可以让同一个命令,通过带上不同的选项表现出不同的功能和作用。

比如:ls -l、ls -l -a、ls -l -a -i。这就是命令行参数的意义。

我们平常在 VS 中写代码,都知道程序是从 main 函数开始执行,那是谁调用的 main 函数呢?
  • 编程者写的 main 函数被 void mainCRTStartup(void) 函数调用的,这个函数定义在 VS 安装目录的某个 .c 文件中(VS 的版本不同,存放的位置也不同),它会执行一些初始化操作,如从内核中获取命令行参数和环境变量值、初始化全局变量、初始化 IO 等等所需各项准备之后,为调用 main(argc, argv, env) 函数做好了准备。
  • 可以通过 main 函数的参数,可以传递命令行参数和环境变量。

五、环境变量的组织方式

main 函数除了可以传递两个和命令行参数相关的参数 argc 和 argv 以外,还可以传递第 3 个参数 env

int main(int argc, char* argv[], char* env[]);

这也是 main 函数获取环境变量的方式。

通过给 main 函数第三个参数传参,把一个个环境变量传递给当前程序,当前程序运行起来变成进程,就意味着当前这个进程获取到了这些环境变量。

每个被 bash 创建的子进程都会接收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以 ’\0’ 结尾的环境字符串(环境变量)。


1、通过 main 的第三个参数获取环境变量

// proc.c
#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[], char* env[]) // 通过第三个参数接收环境变量
{
    for (int i = 0; env[i]; i++) // 循环结束条件为env[i],遍历到NULL停止
    {
        printf("env[%d]: %s\n", i, env[i]); // 遍历字符指针数组env
    }
    return 0;
}

运行结果:获取到了当前 bash 内的所有环境变量。(因为环境变量被 bash 创建的子进程 proc 继承下去了)

所以现在知道 C 库函数 getenv 的实现原理了,比如 printf("%s\n", getenv("PATH"));,其实就是通过在字符指针数组 env 中进行字符匹配,找到 "PATH" 后面的内容并返回。


2、通过全局变量 environ 获取环境变量(了解)

C/C++ 提供了一个全局二级指针变量 char** environ,指向存放环境变量地址的字符指针数组 char* env[ ]。

#include <stdio.h>

int main()
{
    extern char** environ;
    for (int i = 0; environ[i]; i++)
    {
        printf("%s\n", environ[i]); // 等价于 *(environ + i)
    }
    return 0;
}

注意:因为 libc 中定义的全局变量 environ 指向环境变量表,environ 没有包含在任何头文件中,所以在使用时要用 extern 声明。


下面程序运行会报错吗?

不会。

#include <stdio.h>

void show()
{
    printf("hello show\n");
}

int main()
{
    show(10, 20);
    return 0;
}

分析:10 和 20 这两个参数是传给了 show 函数,它们被压入了 show 函数栈帧中,实际上在 show 函数中是可以通过某些指针操作来获取到 10 和 20 的,只是比较复杂。

上述程序中的二级指针 environ 可以通过某种方式在 main 的压栈结构中指向传入的命令行参数 char* env[ ](环境变量表),来获取到环境变量。

标签: linux 环境变量 PATH

本文转载自: https://blog.csdn.net/weixin_74531333/article/details/136059152
版权归原作者 炫酷的伊莉娜 所有, 如有侵权,请联系我们删除。

“【Linux】环境变量及相关指令”的评论:

还没有评论