Skip to content
Merged

Dev #174

Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Binary file added assets/ori.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added assets/txt/img_rot180_demo.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
File renamed without changes
Binary file added assets/txt/textline_rot180_demo.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
File renamed without changes
File renamed without changes
File renamed without changes
Binary file added dnn/DocumentOrientation.simple
Binary file not shown.
Binary file modified dnn/QRCode.simple
Binary file not shown.
Binary file modified dnn/TextChinese.simple
Binary file not shown.
Binary file modified dnn/TextDetection.simple
Binary file not shown.
Binary file added dnn/TextUnwarping.simple
Binary file not shown.
Binary file added dnn/TextlineOrientation.simple
Binary file not shown.
26 changes: 22 additions & 4 deletions docx/CHANGELOG.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,22 @@
# [0.46.0](https://github.com/shelllet/winui/compare/main...dev) (2025-07-22)
# [0.47.0](https://github.com/shelllet/winui/compare/main...dev) (2025-09-22)

### Changed:
1. 优化文字识别动作,文字识别结果已经更改为从上至下的顺序。
2. 支持鼠标右键拖动动作视图。
3. 修复另存时,项目未进入快速启动列表中。
4. 关机动作更新为 [SuspendSystem](./actions/system/SuspendSystem.md), 并且支持休眠。
5. 支持运行当前的工作流。
6. [退出流程] 动作更名,参考: [退出流程](./actions/control/Exit.md)。
7. 增加 [域名查询](./actions/control/DomainQuery.md) 动作, 用于操持流程不退出。

### Note

1. 使用管理员权限运行 *小友+*, 无法显示 *动作* 的拖动效果(已知问题)。
2. 该版本由于内置了一些文字处理相关的模型,安装包大小已经超过 `300M`。
3. 下载(压缩包,解压覆盖本地文件):https://winui.net/_media/simple/小友+0.47.0.zip
4. 下载(安装包):https://winui.net/_media/simple/小友+0.47.0-setup.x64.exe

## [0.46.0](https://github.com/shelllet/winui/compare/main...dev) (2025-07-22)

### Changed:
1. [枚举窗口](./actions/window/EnumWindows.md) 动作不再支持异步处理。
Expand All @@ -10,7 +28,7 @@
### Note

1. 使用管理员权限运行 *小友+*, 无法显示 *动作* 的拖动效果(已知问题)。
3. 64位下载(x64):邀请你加入群组:小友+ http://yun.139.com/m/#/invitation?type=1&msgId=1227933999795726207
2. 64位下载(x64):https://winui.net/_media/simple/小友+0.46.0-setup.x64.exe

## [0.45.0](https://github.com/shelllet/winui/compare/main...dev) (2025-06-13)

Expand All @@ -31,8 +49,8 @@

### Changed:
1. [相机类型](./actions/type/TypeCamera.md) 动作支持工业 USB3/GIGE 接口相机,比如海康相机。
2. 更新 [文字识别](./actions/ai/PaddleOCR.md) 动作,运行加载其它语言模型,用来识别中英文以外的文字。
3. 更新 [文字识别(Tesseract)](./actions/ai/TesseractOCR.md) 动作, 支持基于 *Tesseract* (常用来识别特殊字体)的文字识别。
2. 更新 [文字识别](./actions/ai/TextRecognition.md) 动作,运行加载其它语言模型,用来识别中英文以外的文字。
3. 更新 [文字识别(Tesseract)](./actions/ai/TextExtract.md) 动作, 支持基于 *Tesseract* (常用来识别特殊字体)的文字识别。
4. 添加动作菜单*缓存对象*。 用来解决 某些动作反复执行时,由于内置对象的初始化比较耗,导致不必要的时间开销。
5. 动作支持借助脚本更新运行时参数,详情参考动作说明。
6. 修复导入其它流程崩溃问题。
Expand Down
19 changes: 12 additions & 7 deletions docx/_sidebar.md
Original file line number Diff line number Diff line change
Expand Up @@ -15,7 +15,7 @@
- [变量](./introduction/workflow/variable.md)
- [资源](./introduction/workflow/resources.md)
- [动作](./introduction/workflow/action.md)
- [流程操作技巧](./introduction/workflow/skill.md)
- [内置功能](./introduction/workflow/features.md)
- 浏览器
- [Web 定位策略](./introduction/webdriver/locators.md)
- [WebDriver 下载](./introduction/webdriver/download.md)
Expand All @@ -41,7 +41,7 @@
- [打开应用](./actions/system/OpenApplication.md)
- [打开文件](./actions/system/LaunchFile.md)
- [打开链接](./actions/system/OpenUrl.md)
- [退出系统](./actions/system/ExitWindows.md)
- [退出系统](./actions/system/SuspendSystem.md)
- [关闭句柄](./actions/system/CloseHandle.md)
- [检测进程](./actions/system/ExistProcess.md)
- [终止进程](./actions/system/KillProcess.md)
Expand Down Expand Up @@ -148,11 +148,14 @@
- 深度学习
- [目标分类](./actions/ai/ImageClassification.md)
- [对象检测](./actions/ai/ObjectDetection.md)
- [文字识别](./actions/ai/PaddleOCR.md)
- [文本块检测](./actions/ai/TextDetection.md)
- [文字图像方向矫正](./actions/ai/DocumentOrientation.md)
- [文字图像矫正](./actions/ai/TextUnwarping.md)
- [文字区域检测](./actions/ai/TextDetection.md)
- [文字角度纠正](./actions/ai/TextlineOrientation.md)
- [文字识别](./actions/ai/TextRecognition.md)
- [二维码识别](./actions/ai/QRCode.md)
- [条码识别](./actions/ai/BarcodeDetector.md)
- [文字识别(Tesseract)](./actions/ai/TesseractOCR.md)
- [文本提取](./actions/ai/TextExtract.md)
- 媒体
- [窗口截图](./actions/media/CaptureWindow.md)
- [全屏截图](./actions/media/CaptureScreen.md)
Expand All @@ -171,6 +174,8 @@
- [数据发送](./actions/network/NetworkSend.md)
- [数据接收](./actions/network/NetworkReceive.md)
- [服务连接](./actions/network/NetworkConnect.md)
- [域名查询](./actions/network/DomainQuery.md)

- 统计分析
- [加载文档](./actions/pandas/LoadDocument.md)
- [查询](./actions/pandas/DataFrameQuery.md)
Expand Down Expand Up @@ -241,7 +246,7 @@
- [调用](./actions/control/Invoke.md)
- [停止循环](./actions/control/Break.md)
- [脚本](./actions/control/Code.md)
- [退出流程](./actions/control/Quit.md)
- [退出流程](./actions/control/Exit.md)
- [表达式](./actions/control/CodeExpression.md)
- [引用动作](./actions/control/ActionAlias.md)
- [引用动作(名称)](./actions/control/NameAlias.md)
Expand Down Expand Up @@ -351,7 +356,7 @@
- [FeatureAlgorithm](./enums/FeatureAlgorithm.md)
- [WindowSortDirection](./enums/WindowSortDirection.md)
- [FileExtension](./enums/FileExtension.md)
- [ExitWindowsOption](./enums/ExitWindowsOption.md)
- [SuspendStateOption](./enums/SuspendStateOption.md)
- [WebKey](./enums/WebKey.md)
- [WebLocated](./enums/WebLocated.md)
- [ModuleOption](./enums/ModuleOption.md)
Expand Down
25 changes: 25 additions & 0 deletions docx/actions/ai/DocumentOrientation.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
# 文字图像方向矫正

将文档图像的方向区分出来,并使用后处理将其矫正。在诸如文档扫描、证照拍摄等过程中,有时为了拍摄更清晰,会将拍摄设备进行旋转,导致得到的图片也是不同方向的。此时,标准的OCR流程无法很好地应对这些数据。利用图像分类技术,可以预先判断含文字区域的文档或证件的方向,并将其进行方向调整,从而提高 OCR 处理的准确性。

![DocumentOrientation](./images/09.png ':size=90%')

## 子流程
> 不支持

## 运行参数

* 图像 <sup>1</sup>
> 包含文字的图片。


## 输出

> 参考 [Image](./types/Image.md);

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple



40 changes: 0 additions & 40 deletions docx/actions/ai/PaddleOCR.md

This file was deleted.

38 changes: 21 additions & 17 deletions docx/actions/ai/TextDetection.md
Original file line number Diff line number Diff line change
@@ -1,36 +1,40 @@
# 文本块检测
检测图像上的文本区域
# 文字区域检测
在图像中定位和标记出包含文本的区域。该模块的性能直接影响到整个OCR系统的准确性和效率

![TextDetection](./images/04.png ':size=90%')
![TextDetection](./images/03.png ':size=90%')

## 子流程
> 不支持


## 运行参数

* 图像
> 包含文字的图像
* 图像 <sup>1</sup>
> 包含文字的图片。

* 文本框评分
> 计算文本框的得分,分值太低,则不认为是有效的文本框
* 图像边长限制类型 <sup>2</sup>
> [短边] 表示确保图片最短边不小于 [文本检测的图片边长限制],[长边] 表示确保图片最长边不大于 [文本检测的图片边长限制]

## 输出
* 图片边长限制 <sup>3</sup>
> 对于文本密集的大图像,如果想要更准确的识别,应该选择更大的尺寸。此参数与[文本检测的图像边长限制类型]配合使用。通常,[长边]的最大值适用于图像较大且文本密集的场景,[短边]的最小值适用于图像较小且文本密集的文档场景。

> 检测结果,参考:[DetectionResults](./types/DetectionResult.md)。
## 脚本调用
* 文本检测像素阈值 <sup>4</sup>
> 在输出概率图中,只有得分大于阈值的像素才被视为文本像素,取值范围为 `0 ~ 1`。

```python
import simple;
* 文本检测框阈值 <sup>5</sup>

```
> 当检测结果边框内所有像素的平均得分大于阈值时,该结果将被视为文本区域,取值范围为 `0` 至 `1`。如果出现漏检,可以适当降低此值。

* 文本检测去裁剪比例 <sup>6</sup>
>使用此方法扩展文本区域。值越大,扩展区域越大。

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextDetection.simple
## 输出

> 参考 [`DetectionResults`](./types/DetectionResult.md)。

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple



!> 文字检测模型训练:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/detection.md
Original file line number Diff line number Diff line change
@@ -1,11 +1,11 @@
# 文字识别(Tesseract)
# TextExtract
基于 Tesseract OCR 的一款开源的光学字符识别引擎。能够识别多种语言的文字,包括但不限于英语、中文、法语、德语等。

* 支持多种语言:Tesseract 能够识别多种语言的文字,包括但不限于英语、中文、法语、德语等。通过训练数据的扩展,其语言识别能力还在不断增强。
* 高识别准确率:在经过大量数据训练和优化后,对于清晰的文档图像,Tesseract 可以达到较高的识别准确率。它能够处理多种字体、字号和排版格式的文字,对噪声和图像变形有一定的鲁棒性。
* 可定制性强:用户可以根据自己的需求对 Tesseract 进行定制,例如训练自己的字库模型,以提高对特定领域或特殊字体的识别效果。此外,还可以调*整各种参数来优化识别过程,适应不同的应用场景。

![TesseractOCR](./images/07.png ':size=90%')
![TextExtract](./images/07.png ':size=90%')

## 子流程
> 不支持
Expand All @@ -30,4 +30,4 @@

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/PaddleOCR.simple
示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
27 changes: 27 additions & 0 deletions docx/actions/ai/TextRecognition.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,27 @@
# 文字识别
识别图像中的中文/英文文字。

![TextRecognition](./images/08.png ':size=90%')

## 子流程
> 不支持

## 运行参数

* 图像 <sup>1</sup>
> 包含文字的图片。

* 置信度 <sup>2/sup>
> 文本检测完成后,对文本框内的文字进行文本识别,得分大于该阈值的文本结果将被保留。取值范围为 `0 ~ 1`。


## 输出

> 参考 [`RecognitionResults`](./types/RecognitionResult.md)。

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple



24 changes: 24 additions & 0 deletions docx/actions/ai/TextUnwarping.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,24 @@
# 文字图像矫正
针对图像进行几何变换,以纠正图像中的文档扭曲、倾斜、透视变形等问题,以供后续的文本识别进行更加准确。

![TextUnwarping](./images/11.png ':size=90%')

## 子流程
> 不支持

## 运行参数

* 图像 <sup>1</sup>
> 包含文字的图片。


## 输出

> 参考 [Image](./types/Image.md)。

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple



23 changes: 23 additions & 0 deletions docx/actions/ai/TextlineOrientation.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,23 @@
# 文字角度纠正
角度分类器,默认识别:0°、90° 、270°。 如果使用,则可识别旋转180°的图片。如果文本没有旋转180°,为了性能,请不要使用该选项。其它文本旋转角度无法准确识别。

![TextlineOrientation](./images/10.png ':size=90%')

## 子流程
> 不支持

## 运行参数

* 图像 <sup>1</sup>
> 包含文字的图片,也可以是 [TextDetection](./actions/ai/TextDetection.md) 的结果 。

## 输出

> 如果参数 `1` 是图像, 参考 [Image](./types/Image.md);如果参数 `1` 是 [`DetectionResults`](./types/DetectionResult.md), 参考 [DetectionResults](./types/DetectionResult.md)。

### 其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple



Binary file modified docx/actions/ai/images/03.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docx/actions/ai/images/08.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docx/actions/ai/images/09.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docx/actions/ai/images/10.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docx/actions/ai/images/11.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
2 changes: 1 addition & 1 deletion docx/actions/algorithm/FilterText.md
Original file line number Diff line number Diff line change
Expand Up @@ -10,7 +10,7 @@
## 运行参数

* 数据
> 含有文本的列表,例如 [*文字识别*](./actions/ai/PaddleOCR.md) 动作。
> 含有文本的列表,例如 [*文字识别*](./actions/ai/TextRecognition.md) 动作。

* 文本
> 文本,*字符串* 类型,参考:[String](./types/String.md), 支持 [*通配符(WildCard)*](./introduction/process/wildcard.md) 匹配。
Expand Down
2 changes: 1 addition & 1 deletion docx/actions/algorithm/JoinString.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,5 @@
# 合并字符串
将字符串列表,或者含有字符串的列表(如 [文本检测](./actions/ai/PaddleOCR.md)),合并成字符串。
将字符串列表,或者含有字符串的列表(如 [文本检测](./actions/ai/TextRecognition.md)),合并成字符串。

![JoinString](./images/16.png ':size=90%')

Expand Down
File renamed without changes.
29 changes: 29 additions & 0 deletions docx/actions/network/DomainQuery.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
# 域名查询
域名解析是将域名(例如 www.google.com)转换成 IP 地址(例如 142.251.42.206)的过程,它是互联网运作的基石之一。当你在浏览器中输入一个域名时,幕后会发生一系列复杂的步骤来找到对应的服务器 IP 地址。

![DomainQuery](./images/10.png ':size=90%')

## 子流程

> 不支持

## 运行参数


* 域名
> 要解析的主机名或 IP 地址字符串(如 `www.example.com` 或 `192.168.1.1`)。

* 服务

> 可选参数,通常是端口号或服务名称(如 `80` 或 `http`)。如果只需要解析 IP 地址,可以设置为 NULL。

## 输出

> IP 地址列表,参考[Strings](./types/String.md)。

## 其它





Binary file added docx/actions/network/images/10.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading