人工智能训练师(五级)
模块0 人工智能训练师职业认知
学习单元1 人工智能概论
学习单元2 人工智能训练师岗位认知
模块1 数据采集和处理
课程1-1 业务数据采集
学习单元1 文本与图片数据采集(爬虫)
学习单元2 视频数据采集
学习单元3 语音数据采集
课程1-2 业务数据处理
学习单元1 文本数据清洗
学习单元2 图像数据清洗
模块2 原始数据标注
学习单元1 文本数据标注
学习单元2 图像数据标注
学习单元3 语音数据标注
模块3 Excel的运用技巧
模块4 智能系统运维
学习单元1 智能系统运维基础
学习单元2 常见智能系统介绍
学习单元3 系统功能日志维护
附加0 工作中常用的人工智能软件
-
+
首页
学习单元2 图像数据清洗
- #### 以下练习使用本平台在线工具进行学习。 ## 地址:首页->工作台[【快捷链接】](https://zenodt.com/workbench "【快捷链接】"),点击 _1717661367.png) 按钮,登录即可 ## 1.图像数据的常见特征 **像素**:颜色、亮度、位置 **色彩**:RGB色彩模型、灰度图像、HSV色彩模型 **分辨率**:图像分辨率、图像尺寸、图像格式 **文件格式**:JPEG格式、PNG格式、GIF格式 ## 2.图像清洗的重要性 #### 提高图像质量:去除噪声、增强图片细节、提高图像识别率 #### 便于后续处理:数据质量、算法性能、应用效果 #### 保证数据准确性:去除噪声、处理缺失值、纠正异常值 ## 3.图像清洗的具体内容 ```mindmap # 图像清洗 ### 文件可读性检查 #### 检查文件格式 #### 检查文件完整性 #### 检查文件大小 ### 图像变形失真校正 #### 几何校正 #### 色彩校正 #### 噪声消除 ### 图像清晰度增强 #### 图像去噪 #### 图像锐化 #### 图像对比度增强 ``` #### 下面是一个实例 > **去噪** ``` import cv2 import numpy as np # 读取图像 image = cv2.imread('image.jpg') # 应用高斯滤波去噪 denoised_image = cv2.GaussianBlur(image, (5, 5), 0) # 显示去噪后的图像 cv2.imshow('Denoised Image', denoised_image) cv2.waitKey(0) cv2.destroyAllWindows() ``` > **去除背景** ``` # 转为灰度图像 gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 应用二值化处理 _, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY) # 显示二值化后的图像 cv2.imshow('Binary Image', binary_image) cv2.waitKey(0) cv2.destroyAllWindows() ``` > **图像修复** ``` # 创建一个掩码,标记出需要修复的区域 mask = np.zeros(image.shape[:2], dtype=np.uint8) mask[100:150, 100:150] = 255 # 假设修复区域在(100, 100)到(150, 150) # 应用图像修复 restored_image = cv2.inpaint(image, mask, 3, cv2.INPAINT_TELEA) # 显示修复后的图像 cv2.imshow('Restored Image', restored_image) cv2.waitKey(0) cv2.destroyAllWindows() ``` > **尺寸标准化** ``` # 调整图像尺寸 resized_image = cv2.resize(image, (256, 256)) # 保存为统一格式 cv2.imwrite('resized_image.png', resized_image) ``` > **颜色矫正** ``` # 转为YUV颜色空间 yuv_image = cv2.cvtColor(image, cv2.COLOR_BGR2YUV) # 对Y通道应用直方图均衡化 yuv_image[:, :, 0] = cv2.equalizeHist(yuv_image[:, :, 0]) # 转回BGR颜色空间 corrected_image = cv2.cvtColor(yuv_image, cv2.COLOR_YUV2BGR) # 显示颜色校正后的图像 cv2.imshow('Corrected Image', corrected_image) cv2.waitKey(0) cv2.destroyAllWindows() ``` > **数据增强** ``` from tensorflow.keras.preprocessing.image import ImageDataGenerator datagen = ImageDataGenerator( rotation_range=40, width_shift_range=0.2, height_shift_range=0.2, shear_range=0.2, zoom_range=0.2, horizontal_flip=True, fill_mode='nearest' ) # 加载图像并扩展维度 image = np.expand_dims(image, axis=0) # 生成增强后的图像 for batch in datagen.flow(image, batch_size=1): augmented_image = batch[0].astype('uint8') cv2.imshow('Augmented Image', augmented_image) cv2.waitKey(0) break # 只显示一个增强后的图像 ``` ## 4.图像高度相似与重复图片的处理 #### 4.1图像相似度检测 - 图像特征提取 - 图像特征提取 - 图像特征提取 #### 4.2重复图片识别与删除 ```mindmap # 图像相似度计算 ## 重复图片删除 ### 图像数据清洗 ``` ## 5.图像清洗的挑战与解决方案 #### 5.1复杂背景下的图像清洗: - `光线变化`:在复杂光照条件下,图像清洗需要处理阴影、反光等问题,以保持图像的清晰度和对比度。 - `噪声干扰`:在复杂背景下,图像清洗需要去除噪声干扰,如模糊、颗粒等,以提高图像的质量和清晰度。 - `物体遮挡`:在复杂背景下,图像清洗需要处理物体遮挡问题,如树叶、建筑物等,以提取出有用的图像信息。 #### 5.2大规模图像数据的清洗 - `数据量大`在大规模图像数据清洗中,需要处理大量的图像数据,这对计算资源和处理速度提出了很高的要求。 - `数据质量差`在大规模图像数据清洗中,由于数据来源广泛,数据质量参差不齐,需要采取有效的清洗方法,提高数据质量。 - `数据多样性`在大规模图像数据清洗中,图像数据的多样性也是一个挑战。不同的图像数据可能具有不同的特征和属性,需要采取不同的清洗方法。 ## 6.补充学习,请观看下列视频 
张龙
2024年7月24日 16:56
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码