用 pymysql 操作本地 MySQL 数据库与用 pymongo 操作本地 MongoDB 数据库

前置知识

对于IP 地址，大家并不陌生，特别是在网络访问中我们会经常使用到（平时对域名如百度的www.baidu.com的访问，本质就是对域名所绑定的IP 地址的访问），那么IP 地址是什么呢？

首先，我们要知道网络中的相互访问其实就是在进行两者间的数据传递。就如同送快递一样，快递发出只有知道你的住址信息，才能将快递送到你的手中。而在网络访问时，只有知道你在网络中的地址信息，才能将数据发送到你的设备上。所以，IP 地址就是你在网络中的地址信息。与你现实地址不同的是，你的现实地址使用文字表示，而你在网络中的地址（IP 地址）是用二进制数字表示的。

一般我们会将网络划分公网（连 Internet 的）与内网。

公有 IP 地址

一般称公网中的IP 地址为公有地址。公有地址由 Inter NIC（因特网信息中心）负责，这些IP 地址分配给注册并向 Inter NIC 提出申请的组织机构。公有地址是全球唯一的，公网中不可能存在两个相同的IP 地址。

范围：除了私有地址以外的地址，都属于公有地址

私有 IP 地址

一般称内网（即局域网）中的IP 地址为私有地址。私有地址是非注册地址，用于组织机构内部使用。私有地址的范围如下：

A 类 IP 地址中：10.0.0.0–10.255.255.255
B 类 IP 地址中：172.16.0.0–172.31.255.255
C 类 IP 地址中：192.168.0.0–192.168.255.255

私有地址与公有地址不同，并不是由Internet分配的，是不允许出现在Internet中的，我们在公网中是看不到私有 IP 地址的，并且公有地址也不会使用上述的三类地址。所以，私有地址是不能直接与Internet连接的。

而如果想用私有地址与 Internet 连接来访问公网，那该怎么做？这就需要将私有 IP 地址转换成公网 IP 地址，与外部连接。所以，我们平时使用的路由器中会装有一个叫做 NAT（网络地址转换） 的软件，我们的路由器中会至少会有一个有效的公网 IP，NAT会将我们的私有地址转成路由器中的公网 IP与外部 Internet 连接。而同样的，因为使用的是路由器中的公共的公网 IP来连接 Internet，所以这个内网中的 PC 在 Internet 中显示的都是路由器的公共 IP，这样做不仅提供了一定程度的安全，也可以有效的减缓可用的 IP 地址空间的枯竭问题。（像我们学校或者公司的内网一般都是这么做的）

另外还有一点，在同一个局域网内，IP 地址是唯一的；但是在不同的局域网内，IP 地址是可以重复出现的。

举个小例子: 在局域网 A中，有个主机的IP 地址是192.168.10.128，那么绝不可能在局域网 A中还有其他主机的IP 地址为192.168.10.128。但是在局域网 B中却可以有主机的IP 地址也是192.168.10.128。
如果局域网 A中的192.168.10.128主机与局域网 B中的192.168.10.128主机通信，不会冲突吗？不会，因为上述说过，它们最终都是使用路由器中的公网IP来连接外网的，而公网IP是全球唯一的。

localhost、127.0.0.1 和 0.0.0.0 和本机 IP 的区别

localhost

localhost其实是域名，一般 windows 系统默认将localhost指向127.0.0.1，但是localhost并不等于127.0.0.1，localhost指向的IP 地址是可以配置的

127.0.0.1

首先我们要先知道一个概念，凡是以127开头的IP 地址，都是回环地址（Loop back address），其所在的回环接口一般被理解为虚拟网卡，并不是真正的路由器接口。

所谓的回环地址，通俗的讲，就是我们在主机上发送给127开头的IP 地址的数据包会被发送的主机自己接收，根本传不出去，外部设备也无法通过回环地址访问到本机。

小说明：正常的数据包会从IP层进入链路层，然后发送到网络上；而给回环地址发送数据包，数据包会直接被发送主机的IP层获取，后面就没有链路层他们啥事了。

而127.0.0.1作为{127}集合中的一员，当然也是个回环地址。只不过127.0.0.1经常被默认配置为localhost的IP 地址。
一般会通过ping 127.0.0.1来测试某台机器上的网络设备是否工作正常。

0.0.0.0

首先，0.0.0.0是不能被ping通的。在服务器中，0.0.0.0并不是一个真实的的IP 地址，它表示本机中所有的IPV4 地址。监听0.0.0.0的端口，就是监听本机中所有IP的端口。

本机 IP

本机 IP通常仅指在同一个局域网内，能同时被外部设备访问和本机访问的那些IP 地址（可能不止一个）。像127.0.0.1这种一般是不被当作本机 IP的。本机 IP是与具体的网络接口绑定的，比如以太网卡、无线网卡或者 PPP/PPPoE 拨号网络的虚拟网卡，想要正常工作都要绑定一个地址，否则其他设备就不知道如何访问它。

小例子剧场（帮助理解本机 IP、127.0.0.1 和 0.0.0.0）

现在有两台 pc 在同一个局域网内，分别为 pc1 与 pc2，pc1 上有一个网卡，IP 地址为192.168.10.128

pc1 中 sever 监听127.0.0.1，则 pc1 中的 client 可以连上127.0.0.1，192.168.10.128连不上；而 pc2 中 client 都连不上。
pc1 中 sever 监听192.168.10.128，则 pc1 中的 client 可以连上192.168.10.128，127.0.0.1连不上；而 pc2 中 client 能连上192.168.10.128。
pc1 中 sever 监听0.0.0.0，则 pc1 中的 client 可以连上127.0.0.1和192.168.10.128，pc2 中的 client 能连上192.168.10.128。

一般情况下我们在本地建立的MySQL数据库都是默认域名地址localhost（127.0.0.1）端口号是：3306

上图的两个数据库其实是一个因为他们的 IP 地址都是一样的。

先建立连接到我本地的数据库 lab2

pymysql

import pymysql

def create_mysql_connection(db_name, host, user, password, port):
    connection = pymysql.connect(
        host=host,
        user=user,
        password=password,
        db=db_name,
        port=port,
        charset='utf8mb4',  # 设置字符集为utf8mb4，以支持更多字符
        cursorclass=pymysql.cursors.DictCursor  # 返回字典形式的结果
    )
    return connection

# 使用示例
db_name = 'lab2'
host = 'localhost'
user = 'root'
password = '123'  # 替换为你的数据库密码
port = 3306  # MySQL默认端口是3306，如果你的端口不是这个，需要修改

# 创建连接
try:
    dbc = create_mysql_connection(db_name, host, user, password, port)
    print("MySQL database connection was successful")
except Exception as e:
    print(f"The error '{e}' occurred")

# 关闭连接
# try:
#     connection.close()
#     print("MySQL connection is closed")
# except NameError:
#     print("MySQL connection was not established")

连接成功后会返回

MySQL database connection was successful

获取 MySQL 版本号测试是否连接成功

# 获取MySQL版本号测试是否连接成功
cursor = dbc.cursor()
cursor.execute("select version()")
data = cursor.fetchone()
print(data)

成功后返回我的 MySQL 版本号：{'version()': '8.0.41'}

连接成功后先用 SQL 在 lab2 中创建一张 test_table 表用于接下来的操作

use lab2;
create table test_table(
_id int PRIMARY KEY AUTO_INCREMENT,
articleid varchar(500),
content varchar(500),
userid varchar(500),
nickname varchar(500),
likenum int,
stare int
)

下图中我已向其中添加了一些数据了，请忽略

之后我们就可以写插入函数了：

def insert_data_mysql(connection, data):
    #注意，在pymysql不管原数据库中的列值类型是字符串varchar还是int 占位符一律用 %s pymysql会自己转换数据类型（真棒！^_^）
    sql = "INSERT INTO test_table (_id, articleid, content, userid, nickname, likenum, stare) VALUES (%s, %s, %s, %s, %s, %s, %s )"
    connection.cursor().executemany(sql, data)
    connection.commit()

然后我们自己造些测试数据：

data_to_insert_before_mysql = [[1, '1', '测试一下！', '11', '相忘于江湖', "64", 1]]

再写个循环扩大数据规模，多少条好呢**(*´･д･)?** 1000 条吧：

import copy
def create_data_1000_mysql(data_to_insert):
    for i in range(0,999):
        # 这里一定要注意一定得用深拷贝
        data_to_insert_copy = copy.deepcopy(data_to_insert[i])
        data_to_insert_copy[0] = data_to_insert[i][0] + 1
        # 这里data_to_insert_copy还是一维列表所以记得套个[]
        data_to_insert = data_to_insert + [data_to_insert_copy]
    return data_to_insert

data_to_insert_after_mysql = create_data_1000_mysql(data_to_insert_before_mysql)
print(data_to_insert_after_mysql[-1])

料理完 Mysql 了接下来处理 MongoDB，思路都是一样的只是语法稍微不同

连接：

from pymongo import MongoClient

def create_mongo_connection(uri):
    client = MongoClient(uri)
    return client

# 使用示例
mongo_client = create_mongo_connection('mongodb://localhost:27017/') #这里是默认的端口
mongo_db = mongo_client['test_db']
mongo_collection = mongo_db['test_collection']

测试是否连接成功：

# 列出当前正在使用的数据库以确保连接成功
def list_databases(client):
    databases = client.list_database_names()
    print("Databases in MongoDB instance:")
    for db in databases:
        print(db)

# 调用函数
list_databases(mongo_client)

输出结果：

连接 ok

写 MongoDB 的插入函数：

def insert_data_mongo(collection, data):
    try:
        collection.insert_many(data)
        print("Data inserted successfully into MongoDB.")
    except Exception as e:
        print(f"An error occurred: {e}")

造数据：

data_to_insert_before_mongo = [
    {"_id": 31000, "articleid": "1", "content": "测测", "userid": "11", "nickname": "相忘于江湖", "likenum": 64, "state": 1}
    # 可以在这里添加更多数据
]

来 1000 条：

（和上述 Mysql 造 1000 条的逻辑是一样的，只不过在 pymongo 库中数据是用字典表示的）

def create_data_1000_mongo(data_to_insert):
    for i in range(0,999):
        data_to_insert_copy = copy.deepcopy(data_to_insert[i])
        data_to_insert_copy["_id"] = data_to_insert[i]["_id"] + 1
        data_to_insert = data_to_insert + [data_to_insert_copy]
    return data_to_insert

data_to_insert_after_mongo = create_data_1000_mongo(data_to_insert_before_mongo)
print(data_to_insert_after_mongo[-1])

再简单测试一下二者插入上述相同数据所用时间的差异：

#插入1000条数据的性能测试模块
import time
start_time_sql = time.time()
insert_data_mysql(dbc, data_to_insert_after_mysql)
end_time_sql = time.time()
print(f"MySQL Insert 1000 pieces of data: {end_time_sql - start_time_sql} seconds")
start_time_mongo = time.time()
insert_data_mongo(mongo_collection, data_to_insert_after_mongo)
end_time_mongo = time.time()
print(f"MongoDB Insert 1000 pieces of data: {end_time_mongo - start_time_mongo} seconds")