隨便打開一個Microsoft Visual Studio,新建一個WinForms項目,從下面列表中隨便選擇一個NET框架。目標平臺要設(shè)置成X64,該OCR僅支持64位。
net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;netstandard2.0;netcoreapp3.1;net5.0;net6.0;net7.0;
創(chuàng)建完窗口后,切換到【程序包管理控制臺】,輸入下面命令并回車:
Install-Package PaddleOCRSharp -Version 3.1.0
也可以:項目名稱右鍵點擊》管理nuget程序包,在瀏覽界面,搜索“PaddleOCRSharp”選擇最新版本點擊【安裝】
(資料圖)
按照上面操作完成PaddleOCRSharp的依賴包安裝。
在窗口界面拖放一個按鈕,并雙擊,在按鈕的點擊事件中,輸入以下代碼:
OpenFileDialog ofd = new OpenFileDialog(); ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png"; if (ofd.ShowDialog() != DialogResult.OK) return; var imagebyte = File.ReadAllBytes(ofd.FileName); Bitmap bitmap = new Bitmap(new MemoryStream(imagebyte)); OCRModelConfig config = null; OCRParameter oCRParameter = new OCRParameter (); OCRResult ocrResult = new OCRResult(); //建議程序全局初始化一次即可,不必每次識別都初始化,容易報錯。 PaddleOCREngine engine = new PaddleOCREngine(config, oCRParameter); { ocrResult = engine.DetectText(bitmap ); } if (ocrResult != null) { MessageBox.Show(ocrResult.Text,"識別結(jié)果"); }然后按F5運行,點擊按鈕,選擇一個本地圖片,進行OCR文字識別。
彈出識別結(jié)果,說明你已經(jīng)上手學會了如何使用OCR,就這么簡單。
PaddleOCRSharp項目,是基于百度飛槳OCR代碼修改并封裝的.NET的工具類庫。包含文本識別、文本檢測、基于文本檢測結(jié)果的統(tǒng)計分析的表格識別功能,包含總模型僅8.6M的超輕量級中文OCR,單模型支持中英文數(shù)字組合識別、豎排文本識別、長文本識別。同時支持多種文本檢測。項目封裝極其簡化,實際調(diào)用僅幾行代碼,極大的方便了中下游開發(fā)者的使用和降低了PaddleOCR的使用入門級別,同時提供不同的.NET框架使用,方便各個行業(yè)應用開發(fā)與部署。Nuget包即裝即用,可以離線部署,不需要網(wǎng)絡(luò)就可以識別的高精度中英文OCR。
關(guān)鍵:離線、免費、高精度、開源
項目開源地址:https://gitee.com/raoyutian/paddle-ocrsharp
github地址:https://github.com/raoyutian/PaddleOCRSharp
同時,,該核心PaddleOCR.dll庫,還支持Python.GO.C++.Rust等語言調(diào)用喲!
你get到了嗎?