作者:厦门大学计算机系林子雨副教授
说明:本博客是与林子雨编著《数据采集与预处理》教材配套的教学资料。
操作系统:Ubuntu22.04
数据库:MongoDB6.0
一、MongoDB简介
MongoDB是一个基于分布式文件存储的数据库,采用C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是目前非关系数据库当中功能最丰富、最像关系数据库的数据库。
传统的关系数据库一般由数据库(database)、表(table)和记录(record)3个层次概念组成,而MongoDB由数据库(database)、集合(collection)和文档对象(document)3个层次组成。MongoDB中的集合对应关系型数据库中的表,但是集合中没有列、行和关系概念,这体现了模式自由的特点。MongoDB与关系数据库的概念对比如表1所示。
二、安装MongoDB6.0
- 更新Ubuntu22.04的软件包
在Ubuntu22.04系统中,首先运行系统更新命令,以重建从现有仓库创建的APT软件包缓存。给定的命令还将更新系统中安装的软件包。具体命令如下:sudo apt-get update
还要安装一些其他必需的软件包,命令如下:
sudo apt-get install gnupg curl
- 添加GPG密钥
需要添加GPG密钥,系统将需要该密钥来检查我们在本文中要安装的MongoDB软件包的真实性。命令如下:curl -fsSL https://pgp.mongodb.com/server-6.0.asc | sudo gpg -o /etc/apt/trusted.gpg.d//mongodb-server-6.0.gpg --dearmor
- 在Ubuntu 22.04上添加MongoDB仓库
MongoDB是一种流行的数据库系统,但安装它的软件包不能直接使用Ubuntu 22.04的默认系统仓库。因此,我们需要手动在Ubuntu 22.04 Linux上添加6.0版本的仓库。命令如下:echo "deb [ arch=amd64,arm64 ] https://repo.mongodb.org/apt/ubuntu focal/mongodb-org/6.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-6.0.list
添加仓库后,使用以下命令更新APT索引缓存:
sudo apt-get update
4.安装libssl1.1
MongoDB的安装需要依赖libssl1.1。可以使用如下3条命令安装:echo "deb http://security.ubuntu.com/ubuntu focal-security main" | sudo tee /etc/apt/sources.list.d/focal-security.list sudo apt-get update sudo apt-get install libssl1.1
5.在Ubuntu 22.04上安装MongoDB 6.0
我们的系统现在已经准备好安装MongoDB服务器及其其他工具,例如shell、mongosh等。在Ubuntu 22.04终端中运行以下命令:sudo apt-get install mongodb-org
安装过程会出现提示,输入“Y”进行安装。
6.启动MongoDB服务
启动MongoDB服务并检查MongoDB服务状态,具体命令如下:sudo systemctl start mongod sudo systemctl status mongod
7.进入MongoDB Shell
再新建一个终端窗口,执行如下命令进入MongDB Shell交互式执行环境:mongosh
可以输入如下命令退出MongoDB Shell模式:test> exit
或者也可以直接按键盘的Ctrl+C组合键,退出Shell命令模式。
三、MongoDB基础操作
1. 常用操作命令
常用的操作MongoDB数据库的相关命令包括:
(1)show dbs:显示数据库列表;
(2)show collections:显示当前数据库中的集合(类似关系数据库中的表table);
(3)show users:显示所有用户;
(4)use yourDB:切换当前数据库至yourDB;
(5)db.help() :显示数据库操作命令;
(6)db.yourCollection.help() :显示集合操作命令,yourCollection是集合名;
MongoDB没有创建数据库的命令,如果要创建一个名称为“School”的数据库,需要先运行“use School”命令,之后做一些操作,比如,使用命令“db.createCollection('teacher')”创建集合,这样就可以创建一个名称为“School”的数据库。
2.简单操作演示
下面以一个School数据库为例进行操作演示,将在School数据库中创建两个集合teacher和student,并对student集合中的数据进行增、删、改、查等基本操作。需要说明的是,文档数据库中的集合(Collection),相当于关系型数据库中的表(table)。
(1)切换到School数据库
命令如下:
use School
注意,MongoDB无需预创建School数据库,在使用时会自动创建。
(2)创建集合
创建集合(Collection)的命令如下:
db.createCollection('teacher')
执行上述命令的屏幕截图如图9所示。
图9 创建集合
实际上,MongoDB在插入数据的时候,也会自动创建对应的集合,无需预定义集合。
(3)插入数据
插入数据的具体命令如下:
db.student.insertOne({_id:1, sname: 'zhangsan', sage: 20}) #_id可选
运行完以上命令,student已自动创建,这也说明MongoDB不需要预先定义集合(collection),在第一次插入数据后,集合会被自动创建。此时,可以使用“show collections”命令查询数据中当前已经存在的集合,如图10所示。
图10 show collections命令执行结果
(4)查找数据
查找数据所使用的基本命令格式如下:
db.youCollection.find(criteria, filterDisplay)
其中,criteria表示查询条件,是一个可选的参数;filterDisplay表示筛选显示部分数据,如显示指定某些列的数据,这也是一个可选的参数,但是,需要注意的是,当存在该参数时,第一个参数不可省略,若查询条件为空,可用{}做占位符。
(a)查询所有记录
db.student.find()
该命令相当于关系数据库的SQL 语句“select * from student”。
(b)查询sname='zhangsan'的记录
db.student.find({sname: 'zhangsan'})
该命令相当于关系数据库的SQL 语句“select * from student where sname='zhangsan'”。
(c)查询指定列sname、sage数据
db.student.find({},{sname:1, sage:1})
该命令相当于关系数据库的SQL 语句“select sname,sage from student”。其中,sname:1 表示返回sname列,默认_id字段也是返回的,可以添加_id:0 (意为不返回_id),写成{sname: 1, sage: 1,_id:0 },就不会返回默认的_id字段了。
(d)AND条件查询
db.student.find({sname: 'zhangsan', sage: 20})
该命令相当于关系数据库的SQL 语句“select * from student where sname = 'zhangsan' and sage = 20”。
(e)OR条件查询
db.student.find({$or: [{sage: 20}, {sage: 25}]})
该命令相当于关系数据库的SQL 语句“select * from student where sage = 22 or sage = 25”。
(5)修改数据
修改数据的基本命令格式如下:
db.youCollection.updateOne(criteria, objNew, upsert, multi )
对于该命令做如下说明:
(1)criteria:表示update的查询条件,类似sql update查询内where后面的条件;
(2)objNew : update的对象和一些更新的操作符(如$set)等,也可以理解为SQL语句中的update语句中的set后面的内容。
(3)upsert : 如果不存在update的记录,是否插入objNew,true表示插入,默认是false,表示不插入。
(4)multi: MongoDB默认是false,只更新找到的第一条记录,如果这个参数为true,就会把按条件查出来的多条记录全部更新。默认是false,只修改匹配到的第一条数据。
上面各个参数中,其中criteria和objNew是必选参数,upsert和multi可选参数。
这里给出一个实例,语句如下:
db.student.updateOne({sname: 'zhangsan'}, {$set: {sage: 22}}, false, true)
该命令相当于关系数据库的SQL 语句“update student set sage =22 where sname = 'zhangsan';”。执行该命令的屏幕截图如图11所示。
图11 修改数据
(6)删除数据
db.student.deleteOne({sname: 'zhangsan'})
该命令相当于关系数据库的SQL 语句“delete from student where sname='chenliu'”。
执行该命令过程的屏幕截图如图12所示。
图12 删除数据
(7)删除集合
db.student.drop()