Question

假设我有一张带有条形图的图像，如下所示：

我想提取条形图和标签的值，除了训练ML模型之外，还有其他方法吗？

我有一堆图像，并为其生成了图形和一些描述。我目前正在尝试仅从描述中提取信息，但是我意识到那里的信息有限。因此，我也想从图像中提取信息。是否有可能以最简单的方式实现这一目标？

一些参考资料将非常有帮助。语言首选项是Python。我对如何操作图像一无所知。

注意：图像和说明是我创建的。

Answer 1

如果生成图的原始代码不可用，请安装tesseract，然后安装PIL和pytesseract。

sudo apt-get install tesseract-ocr

sudo -H pip3 install pillow pytesseract

您可能还想download the French datafiles并将其放在/usr/share/tesseract-ocr/tessdata上。

我将您的图片另存为chart.png，然后编写了以下代码。

import pytesseract
from PIL import Image
img = Image.open('chart.png')

print(pytesseract.image_to_string(Image.open('chart.png'),lang='fra'))

这是输出。

Château d’AzayflefRideau

Château et musée de Blois

Château des Bau>«dæProvence
Crypte archéologique de NotræDame
Théâtre antique et musée d’Orange

Château d’Angers

Château des ducs de Bretagne, musée
d'histoire de Nantes

281

271

258

223

197

184

180

2 000

4 000 6 000 8 000
Number of V|s|tors ln thousands

10 000

12

如果您所有的图像都遵循完全相同的格式，那么现在我们要做的就是使其具有可读性。

import pytesseract
from PIL import Image
import re
img = Image.open('chart.png')
s = pytesseract.image_to_string(img,lang='fra')
y_axis = s.split('\n')
y_axis = [x for x in s if x.isdigit()]
x_axis = s.split('\n\n')
x_axis = [x for x in x_axis if x[0].isalpha()]
x_axis = '\n'.join(x_axis)
x_axis = re.split('(\n[A-Z])',x_axis)
x_axis = [x_axis[0]] + [ ''.join(x) for x in zip(x_axis[1:][0::2],x_axis[1:][1::2]) ]
x_axis = [x.rstrip('\n') for x in x_axis]
x_axis = [x.lstrip('\n') for x in x_axis]
x_axis = [ re.sub('\n',' ',x) for x in x_axis]
y_axis = y_axis[0:len(x_axis)]
result = list(zip(x_axis,y_axis))
print(result)

现在您有了：

[（'AzayflefRideau城堡，'281'），（'Blois城堡和博物馆”， '271'），（'宝藏城堡（Châteaudes Bau）«dæProvence'，'258'），（'Cryptearchéologique deNotræDame”，“ 223”），（“Théâtreantique etmuséed'Orange”，“ 197”），（'Châteaud'Angers'，'184'），（“Châteaudes ducs de Bretagne，musée d'histoire de Nantes“，'180'）]

如果在将图像传递到pytesseract之前将其一分为二，则此代码可以变得更简单（一个用于左侧的标签，另一个用于条形和数字）。

从图像中提取统计数据/信息

1 个答案: