最开始,博主介绍一下自己的环境:
SQL Sever 2008 R2
SQL Sever 大致都差不多
1. 通过自带软件的方式
首先找到下载SQL Sever中提供的导入导出工具
如果开始界面没有找到自己下载的路径
C:\Program Files\Microsoft SQL Server\100\DTS\Binn下的DTSWizard.exe文件
导出
1.1 打开界面
1.2 选择自己的数据源和数据库
1.3 选择导出目标
这里博主导出到Excel文件当中
1.4 选择直接导出数据还是进行查询
查询的话将自己在SSMS上编写的SQL语句直接复制到框中即可(确保SQL正确,可以进行测试!)
这里博主直接导出表中数据
1.5 选择表目标
这里需要切记表的分隔符为:
行:{CR}{LF}
列:制表符
格式不对,可能导出的结构出错
(也就是不按照行列的方式导入到Excel当中!)
1.6 完成导出
1.7 检查是否导出成功
可以看到Excel表格中出现新数据!
导入
1.1 打开界面
1.2 选择数据源
这里博主选择的是Excel表格
这里的标题分隔符选{CR}{LF}
这里博主前面有6行垃圾数据(所以选择跳过6行)
行分隔符{CR}{LF}
列分隔符制表符
1.3 选择导入目标数据库
选择自己的服务器和数据库
1.4 选择表
导入的目标表
1.5 选择数据类型映射
1.6 完成导入
1.7 检查是否导入成功
选择SSMS工具
打开对应的表和数据行
查看数据,可以看到数据导入成功!
SQL Sever 2008 R2 存在的问题:
这是SQLSever2008R2所独有的,其他版本不清楚,自行了解!
对于还未和SQL Sever数据库建立过链接的新建Excel表格无法导入导出数据!
所以咱们需要先让Excel表格和数据库建立连接
1.1 随便找个表查看表中数据
1.2 选择将结果保存到文件
右键SQL语句框出现如下界面
1.3 右键选择执行
1.4 保存结果
1.5 查看文件
可以看到Excel文件中出现了数据,但是这些数据无法分析(无效数据),将这些数据删除就可以正常进行导入导出。
2. 通过Pycharm(ODBC)的方式
代码如下所示:
import pyodbc
import pandas as pd
# 创建连接字符串
conn_str =(
r'DRIVER={SQL Server Native Client 10.0};'
r'SERVER=BF-202403241716;'
r'DATABASE=scott;'
r'Trusted_Connection=Yes;')# 建立连接
cnxn = pyodbc.connect(conn_str)# 创建游标对象cursor= cnxn.cursor()# 执行SQL查询
query ="SELECT * FROM dbo.salgrade"cursor.execute(query)# 获取查询结果
data1 =cursor.fetchall()print(type(data1))print(data1)# 获取列名
columns1 =[column[0]forcolumnincursor.description]print(type(columns1))print(columns1)# 将元组列表展开为一维数组
data1 =[list(item)for item in data1]print(type(data1))print(data1)# 将结果转换为DataFrame
df1 = pd.DataFrame(data1,columns=columns1)print(df1)# 将数据写入Excel文件
df1.to_excel('output.xlsx',index=False)# 关闭数据库连接cursor.close()
cnxn.close()
关键点1:连接方式
数据库是:SQL Sever 2008 R2 所以这里采用的连接方式是SQL Sever Native Client 10.0 如果是更新的版本应该是16或者其他
(可以问问ChartGPT)
# 创建连接字符串
conn_str =(
r'DRIVER={SQL Server Native Client 10.0};'
r'SERVER=BF-202403241716;'
r'DATABASE=scott;'
r'Trusted_Connection=Yes;')
具体的服务器和数据库按照自己的来,这里我SQL Sever通过验证的方式是Windows验证,所以这里
r'Trusted_Connection=Yes;'
如果有用户密码,请使用用户密码的方式登录。
关键点2:元组列表需要转换为一维数组(???)
# 将元组列表展开为一维数组
data1 =[list(item)for item in data1]print(type(data1))print(data1)
<class 'list'>[(1,700,1200),(2,1201,1400),(3,1401,2000),(4,2001,3000),(5,3001,9999)]<class 'list'>[[1,700,1200],[2,1201,1400],[3,1401,2000],[4,2001,3000],[5,3001,9999]]
grade losal hisal
0170012001212011400231401200034200130004530019999
需要将元组列表展开为一维数组
原因:data1 是一个包含元组的列表,每个元组都是一个行,但是传递给DataFrame的每行数据应该是一维的,如果不进行转换,那么传递的数据就是二维的
会出现如下类型不匹配的报错==(解决了半天,还是有点不理解)==
import pyodbc
import pandas as pd
# 假设data是cursor.fetchall()返回的结果,它是一个包含元组的列表data=[(1,700,1200),(2,1201,1400),(3,1401,2000),(4,2001,3000),(5,3001,9999)]print(type(data))print(data)# 获取列名columns=['grade','losal','hisal']# 确保这些列名与您的表中的列名相匹配print(type(columns))print(columns)# 将结果转换为DataFrame
df = pd.DataFrame(list(data),columns=columns)print(df)
code2当中代码如上,同样还是一个包含元组的列表,但是就是可以转换成DataFrame的形式==(很奇怪啊)==
关键点3:import导包
如果直接从官网进行下载的话,速度可能会很慢,而且有时候还会断开连接,所以可以选择一些国内的镜像网站
pip install some-package -i https://pypi.tuna.tsinghua.edu.cn/simple
以下这种方式就很慢:
(.venv) PS D:\code\test_3_29> pip install openpyxl
Collecting openpyxl
Downloading openpyxl-3.1.2-py2.py3-none-any.whl.metadata (2.5 kB)
Collecting et-xmlfile (from openpyxl)
Downloading et_xmlfile-1.1.0-py3-none-any.whl.metadata (1.8 kB)
Downloading openpyxl-3.1.2-py2.py3-none-any.whl (249 kB)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 250.0/250.0 kB 547.4 kB/s eta 0:00:00
Downloading et_xmlfile-1.1.0-py3-none-any.whl (4.7 kB)
Installing collected packages: et-xmlfile, openpyxl
Successfully installed et-xmlfile-1.1.0 openpyxl-3.1.2
成功结果如下:
方法放在gitee上了,自取哟!
版权归原作者 哈茶真的c 所有, 如有侵权,请联系我们删除。