作者:厦门大学计算机系林子雨副教授
E-mail: ziyulin@xmu.edu.cn
备注:本实验与林子雨编著《数字素养通识教程》和《人工智能通识教程》教材配套
Nano Banana 是谷歌于2024年推出的AI图像生成与编辑模型,正式名称为 Gemini 2.5 Flash Image 。其在权威的LMArena基准测试中综合评分超越众多竞品,标志着2025年AI 图像生成技术的重大突破。它基于Google DeepMind最新架构,采用原生多模态设计,统一处理文本理解、图像生成与编辑等功能,拥有32K上下文窗口,能进行复杂多轮对话和编辑,还内置丰富世界知识。其核心技术能力强大,不仅支持文本描述转图像,还具备深度语义理解能力,能理解物理规律、时间概念、逻辑推理等。例如输入 “这个披萨在 400 度烤箱里烤 2 小时”,能生成烤焦的披萨图像。Nano Banana 的智能图像编辑引擎可精准局部编辑,如面部美化、体型调整且保留细节;角色一致性保持算法能解决 AI 图像生成领域角色一致性难题,面部特征保留率达 99%。在速度方面,仅需 2.3 秒就能生成 1024×1024 的高质量图像 。
基于大模型和Spark的B站数据分析
【版权声明】版权所有,严禁转载,严禁用于商业用途,侵权必究。
作者:厦门大学计算机科学与技术系2024级研究生 陈增辉
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
时间:2025年6月
相关教材:林子雨、郑海山、赖永炫编著《Spark编程基础(Python版,第2版)》(访问教材官网)
相关案例:基于Python语言的Spark数据处理分析案例集锦(PySpark)
数据集和代码下载:从百度网盘下载本案例数据集和代码。(提取码是ziyu)
在Linux中安装Eclipse
Eclipse是常用的程序开发工具,本教程很多程序代码都是使用Eclipse开发调试,因此,需要在Linux系统中安装Eclipse。
可以到Eclipse官网(https://www.eclipse.org/downloads/) 下载安装包,或者直接访问教程官网下载该软件,位于“下载专区”的“软件”目录下,文件名是eclipse-4.7.0-linux.gtk.x86_64.tar.gz。假设安装文件下载后保存在了Linux系统的目录“~/Downloads”下,下面执行如下命令对文件进行解压缩:
cd ~/Downloads
sudo tar -zxvf ./eclipse-4.7.0-linux.gtk.x86_64.tar.gz -C /usr/local
然后,执行如下命令启动Eclipse:
cd /usr/local/eclipse
./eclipse
这时,就可以看到Eclipse的启动界面了。
大数据软件安装和基础编程实践指南(2025年5月版)
版权声明:版权所有,请勿转载。
作者:厦门大学计算机系林子雨副教授
E-mail: ziyulin@xmu.edu.cn
摘要:本博客介绍如何在Linux系统中安装各种大数据软件,包括Hadoop、HBase、Spark、Hive、Flink等,以及如何进行编程。本博客内容与林子雨编著《大数据技术原理与应用(第4版,高职版)》(访问教材官网)教材配套。
使用coze搭建基于DeepSeek大模型的智能体实现智能客服问答
作者:厦门大学信息学院计算机科学系2023级研究生 曹基民
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
本章实验完全依托于coze在线平台,不需要本地部署任何应用。
本章以搭建关于厦门大学数据库实验室的客服为例,如有搭建其他客服的需要,可以修改相关内容自行搭建。
基于Ollama + Open-Webui实现局域网内DeepSeek大模型分享以及知识库构建
作者:厦门大学信息学院计算机科学系2023级研究生 黄万嘉
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
部分行业(如金融、医疗、政务等)对数据存储和传输有严格的合规要求,在局域网内部署DeepSeek可以满足监管需求。同时,内网部署 DeepSeek 并使用局域网共享,不仅能够提升数据安全性和服务稳定性,还能满足团队高效协作、合规管控和定制化需求,是团队或企业内部智能化升级的理想选择。
基于此,本文采用Ollama + Open-Webui的方案,实现宿主机本地部署DeepSeek等大模型并构建知识库,其他同一局域网内的用户机可以通过浏览器使用DeepSeek以及宿主机构建的知识库。
基于Cherry Studio实现DeepSeek大模型 + RAG知识库
作者:厦门大学信息学院计算机科学系2023级研究生 黄万嘉
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
Cherry Studio 是一款功能强大的跨平台桌面客户端,专为支持多模型服务而设计,旨在为用户提供高效、便捷的 AI 交互体验。它集成了超过 300 个大语言模型,支持多种主流 AI 服务商(如DeepSeek ),并兼容本地模型运行(通过 Ollama),满足用户在不同场景下的需求。
本文使用到的工具及模型有:
- Ollama:模型部署工具
- DeepSeek R1 1.5b:推理模型,基于Ollama本地部署
- nomic-embed-text:嵌入模型,用于对输入的文件(知识)进行向量化
- Cherry Studio:集成各功能的AI助手平台
通过上述工具和模型,可以构建一个本地的知识库,帮助大模型进行更准确地回复。
基于DeepSeek大模型和Page Assist构建本地知识库
作者:厦门大学信息学院计算机科学系2023级研究生 黄万嘉
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
在构建本地知识库时,通常会结合 Page Assist 和 nomic-embed-text,常见的方案为:
- 使用 nomic-embed-text 模型将知识库文档向量化。
- 当用户提问时,将问题向量化并与知识库中的文档向量进行相似性匹配,找到最相关的上下文。
- 将检索到的上下文输入大语言模型(如 DeepSeek),生成最终的回答
Page Assist提供了一个本地大模型的Web UI,同时也提供了方便的RAG设置,使得我们更快捷地构建本地知识库,基于此,本文采用Page Assist,基于DeepSeek大模型,实现了用户提供本地知识库(.pdf/.csv/.docx/.md),大模型进行更加专业地回复。
在本地计算机上利用AnythingLLM构建DeepSeek大模型本地知识库
作者:厦门大学信息学院计算机科学系2023级研究生 曹基民
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
系统要求:win10及以上
硬盘空间:10G以上
硬件要求:
CPU:Intel Core i5/AMD Ryzen 5及以上
GPU:无强制要求,有1GB及以上显存可提升性能