API MISTRAL جديد يسهل دمج PDF في أنظمة الذكاء الاصطناعى

يقوم Mistral بتشغيل واجهة برمجة تطبيقات تقوم بتحويل PDF إلى Markdown ، وهو تنسيق رئيسي لمعالجة النصوص من خلال الذكاء الاصطناعي ، مما يسهل الوصول إلى البيانات للشركات.

Tl;dr

  • أطلقت Mistral واجهة برمجة تطبيقات OCR التي تحول PDF إلى ملفات Markdown ، مناسبة لنماذج الذكاء الاصطناعي.
  • يكتشف واجهة برمجة التطبيقات ودمج العناصر المرئية ، مثل الصور والرسومات ، في النتيجة.
  • يوفر Mistral OCR أداءً أفضل ، من حيث السرعة والدقة ، مقارنة بالحلول الحالية ، وخاصة بالنسبة للوثائق المعقدة والمتعددة اللغات.

واجهة برمجة تطبيقات مبتكرة متعددة الوسائط على OCR

الناشئة الفرنسيةخطأكشفت النقاب عن API على OCR ، والتي تسمى MISTRAL OCR ، والتي تتيح لك تحويل أي مستند PDF إلى نص منظم. على عكس واجهات برمجة تطبيقات OCR الكلاسيكية ، فإن OCR MISTRAL ليس راضياً عن إنتاج تدفق نص خام. هذه التكنولوجيا قادرة على اكتشاف ودمج العناصر المرئية ، مثل الصور والرسومات ، في النتيجة النهائية.يتم تحديد العناصر الرسومية من خلال مربعات تحديد الحدود وإدراجها في ملف الإخراج ، مما يجعل المحتوى أكثر اكتمالا وإخلاصًا للأصل.يتيح ذلك نماذج الذكاء الاصطناعى لفهم المعلومات المرئية والنصية بشكل أفضل ومعالجتها.

التنسيق ، تنسيق رئيسي لمنظمة العفو الدولية

واحد من تفاصيلسوء OCRهو استخدامه لتنسيق تخفيض. يفضل هذا التنسيق على نطاق واسع من قبل المطورين لتنظيم النص عن طريق إضافة الروابط والعناوين وعناصر التنسيق الأخرى. إن استخدام Markdown يجعل من الممكن جعل البيانات أكثر سهولة وتكييفها مع نماذج اللغة ، مثل تلك المستخدمة من قبل مساعدي الذكاء الاصطناعى مثلchatgpt. هذا النهج أمر بالغ الأهمية في بيئة تتغذى فيها الذكاء الاصطناعي على البيانات النصية والمهيكلة لإنتاج نتائج محددة. وبالتالي ، فإن OCR Mistral يسهل عمل الشركات من خلال السماح لها بتحويل المستندات المعقدة بسرعة إلى تنسيق قابل للاستغلال بسهولة بواسطة أنظمة الذكاء الاصطناعي.

أداء متفوق على الحلول الأخرى

وفقًا لـ MISTRAL ، يتجاوز واجهة برمجة تطبيقات OCR الخاصة به الحلول التي اقترحها عمالقة آخرين في القطاع ، مثل Google ،Microsoftو Openai. اختبرت الشركة نموذجها على المستندات المعقدة ، بما في ذلك التعبيرات الرياضية والتخطيطات المتقدمة والجداول. يعمل Mistral OCR بشكل جيد بشكل خاص مع المستندات باللغات غير الإنجليزية ، وهو مجال تكافح فيه تقنيات التعرف الضوئي على الحروف الأخرى في بعض الأحيان لتقديم نتائج محددة. إن سرعة وكفاءة API هي أيضًا أصول رئيسية ، وذلك بفضل تركيزها على وظيفة واحدة ، وهي تحويل مستندات PDF إلى تنسيق تخفيض. هذا يسمح له أن يكون أسرع وأكثر دقة من الحلول العامة.

تطبيقات متعددة للشركات

يفتح Mistral OCR العديد من الفرص للشركات التي تدير كميات كبيرة من المستندات. على سبيل المثال ، يمكن لشركات المحاماة استخدامها لمعالجة كميات كبيرة من العقود والملفات القانونية بسرعة. ستتمكن الشركات التي تحتاج إلى تبسيط الوصول إلى وثائقها الداخلية من الاستفادة من هذه التكنولوجيا لجعل أرشيفها في متناول نماذج الذكاء الاصطناعى. بالإضافة إلى ذلك ، فإن واجهة برمجة التطبيقات متوافقة مع أنظمة الخرقة (الجيل المتمثل في الاسترجاع) ، مما يجعل من الممكن استخدام المستندات متعددة الوسائط كمدخلات في نموذج توليد النص. وبالتالي ، يمكن أن يحول OCR Mistral الطريقة التي تتفاعل بها الشركات مع الذكاء الاصطناعي ومعالجة بياناتها الداخلية.

هل تحب المحتوى الخاص بنا؟

تلقي أحدث منشوراتنا كل يوم مجانًا ومباشر في صندوق البريد الخاص بك

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.