当前位置：首页 > JavaScript

js实现ocr

2026-03-14 05:13:17JavaScript

实现 OCR 的 JavaScript 方法

使用 JavaScript 实现 OCR（光学字符识别）可以通过多种方式完成，以下是几种常见的方法：

使用 Tesseract.js

Tesseract.js 是一个流行的 JavaScript OCR 库，基于 Tesseract OCR 引擎。它可以直接在浏览器中运行，支持多种语言。

安装 Tesseract.js：

npm install tesseract.js

示例代码：

const Tesseract = require('tesseract.js');

Tesseract.recognize(
  'path/to/image.jpg',
  'eng',
  { logger: m => console.log(m) }
).then(({ data: { text } }) => {
  console.log(text);
});

使用浏览器 API

现代浏览器提供了 WebAssembly 和 Canvas API，可以结合 OCR 库实现前端 OCR。

示例代码：

const canvas = document.createElement('canvas');
const ctx = canvas.getContext('2d');
const img = new Image();

img.onload = function() {
  canvas.width = img.width;
  canvas.height = img.height;
  ctx.drawImage(img, 0, 0);
  const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
  // 将 imageData 传递给 OCR 处理
};

img.src = 'path/to/image.jpg';

使用云服务 API

Google Cloud Vision、Azure Computer Vision 或 AWS Textract 提供了 OCR 功能，可以通过 JavaScript 调用它们的 API。

Google Cloud Vision 示例：

const vision = require('@google-cloud/vision');
const client = new vision.ImageAnnotatorClient();

async function detectText() {
  const [result] = await client.textDetection('path/to/image.jpg');
  const detections = result.textAnnotations;
  console.log('Text:');
  detections.forEach(text => console.log(text.description));
}

detectText();

使用 OpenCV.js

OpenCV.js 是 OpenCV 的 JavaScript 版本，可以用于图像预处理，提高 OCR 识别率。

示例代码：

const cv = require('opencv.js');

cv.onRuntimeInitialized = () => {
  const src = cv.imread('image.jpg');
  const dst = new cv.Mat();
  cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY);
  cv.threshold(dst, dst, 127, 255, cv.THRESH_BINARY);
  // 将处理后的图像传递给 OCR 引擎
};