Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

مشاريع مطلوب محاكاتها بالعربية وتوحيدها #9

Open
AhmedElTabarani opened this issue Jan 9, 2022 · 22 comments
Assignees

Comments

@AhmedElTabarani
Copy link

AhmedElTabarani commented Jan 9, 2022

هنا سأعرض بعض المشاريع والخدمات التي يجب تواجدها
بعض المشروعات قد تكون بسيطة وسهلة وتافهه لكن صدقني الأمور الصغير تحدث فارقا

1. توليد نصوص وجمل عشوائي مثل لوريم إيبسوم

قد يكون هذا غريبا أو تافه لكن نحتاج أن يكون لدينا شيء مثل نص لوريم إيبسوم لكن بالعربي

هنا بعض الحقائق عن لوريم إيبسوم في هذا الموقع

أصله ؟
خلافاَ للاعتقاد السائد فإن لوريم إيبسوم ليس نصاَ عشوائياً، بل إن له جذور في الأدب اللاتيني الكلاسيكي منذ العام 45 قبل الميلاد، مما يجعله أكثر من 2000 عام في القدم

كما يقول الموقع فالنص ليس عشوائيا بل هو نص لاتيني قديم مقتبس من كتاب من اكثر من 20 قرن

لما لا يكون لدينا شيء مشابه له لكن باللغة العربية

  • استخدام نص لوريم إيبسوم بالعربي ليس حلا بالمناسبة
  • ترجمة نص لوريم ايبسوم من اللاتيني للعربي ليس حلا أيضا

النص له اصل عتيق، نحتاج شيء مميز
يمكننا على سبيل المثال استخدام القصائد أو الشعر العربي لنص توليدي، هذه مجرد فكرة نحتاج إلى أن نحوم حولها

هناك أشخاص صنعوا إضافات لتوليد نصوص عشوائية مثل:

راجع التعليق التالي من @schehata صاحب مشروع مصباح

لكن كما قلت نحتاج شيء مميز وأيضا نحتاج نوحده وهذا هو الأهم أن يكون موحد متعارف لذا الجميع

وشيء أخر مهم جدا وهو ما أشار إليه @MuhammadSawalhy
في تعليقه

نصوص ال lorem لابد ألا تكون جاذبة للمطلع عليها أن يقرأها ليفهم ما فيها، لكن يجب أن تكون مالئة للفراغ المخصص للنص موضحة شكل النص ولونه. ال Lorem تستخدم أكثر ما تستخدم في التصميم والنمذجة الأولية

يجب توفر تلك الشروط التالية

  • يجب أن يكون نص واحد ثابت وليس مجموعة من النصوص العشوائية
  • يجب ألا يكون جاذب للقراءة لأنه مجرد نص يستخدم لملئ فراغ لا اكثر راجع هذا التعليق
    • ليس له معنى مباشر ولا يفهم منه شيء حين تقرأه
    • نص شعري قديم أو نص يتضمن كلامات ونصوص عربية قديمة عتيقة الشخص المعاصر لن يفهمه

2. مكتبة تحتوي على بيانات عشوائية مثل faker.js

مكتبة faker.js تعد من اكبر المكاتب لتوليد بيانات عشوائية

Generate massive amounts of fake data in the browser and node.js

كما يقول الوصف فإنها تولد كمية كبيرة من البيانات المزيفة لاستخدامها في المشروعات سواء بغرض التجربة أو العرض على سبيل المثال
المكتبة ضخمة بمعنى الكلمة فهي تتضمن بيانات عن أشخاص وعناوين وحيوانات وشركات وقواعد بيانات كاملة والقائمة تطول

الفكرة أننا نحتاج مكتبة مثل هذه لكن البيانات تكون باللغة العربية

يوجد مكتبة ضمن مكاتب الـ PHP تدعى Faker PHP
تحتوي على بيانات عربية

راجع التعليق التالي من @WatheqAlshowaiter:

  • لا داعي لتقليد المكتبة بحذافيرها وهذا خطأ على أي حال
  • لا داعي أن تتضمن نفس محتوى
  • يجب أن تكون المكتبة لها API ويمكننا أن نجعلها ضمن مكاتب الـ npm و pip و gem وغيرها

3. تحويل كتب العلوم والدينية أو المعاجم والقواميس إلى API من أجل المطورين

قد يكون هذا من أضخم الأمور واهم الأمور
أننا يجب أن ننقل المعلومات التي في الكتب إلى العالم الرقمي
سواء كان API أو ملفات JSON للتحميل
لكي يستفيد منه المطورين وليقد المطور على أن ينشيء مشروعات وتطبيقات بها

والحمد لله لدينا فعلًا حصيلة كبيرة في نقل القرآن الكريم وكتب الأحاديث إلى API
لكن لما لا نطمع بالمزيد ماذا ينقسنا وما هو المهم لنقله إلى العالم الرقمي

ماذا ينقصنا إذا من الـ APIs ؟

  • كل أحرف القرآن الكريم
  • تفسير الآيات
  • تفسير أحاديث البخاري و مسلم وما تيسر من الكتب الأحاديث (الكتب التسعة مثلًا)
  • المعاجم والقواميس العربية (ما تيسير من الكتب)
  • أشعار العرب (ولم لا؟)
  • منظومات وقصائد علوم الشريعة (منظومات وقصائد السلف والعلماء)
  • إلخ...

كيف يمكن ذلك؟

الموضوع كما قلت يحتاج مجهود كبير
هناك طريقة لاستخراج النصوص العربية من الصور أو كتب الـ PDF
يمكنك أن تتفقد هذا المنشور على موقع لينكيد إن يشرح طريقة استخراج النصوص

تفقد هذا المنشور من شركة AraData

بالطبع يجب أن يتم مراعاة تدقيق تلك النصوص وتنظيمها لاستخراج منها المعلومات القيمة والمرادة لعمل API بها

4. طريقة bionic-reading بالعربي

الموقع الرسمي https://bionic-reading.com/
تفقد هذا المنشور

5. ناقش بأي اقتراح في التعليقات 🔽

@MuhammadSawalhy
Copy link
Collaborator

هناك أشخاص صنعوا إضافات لتوليد نصوص عشوائية مثل:

@MuhammadSawalhy
Copy link
Collaborator

نصوص ال lorem لابد ألا تكون جاذبة للمطلع عليها أن يقرأها ليفهم ما فيها، لكن يجب أن تكون مالئة للفراغ المخصص للنص موضحة شكل النص ولونه. ال Lorem تستخدم أكثر ما تستخدم في التصميم والنمذجة الأولية

@schehata
Copy link
Contributor

يمكننا تطوير مصباح أكثر، هذه النسخة هى نسخة أولية ومازالت بها بعد الأخطاء، لكن وصلتني بعد الأفكار من خلال تويتر وجاري العمل عليها.

@WatheqAlshowaiter
Copy link

بالمناسبة
Faker PHP
يمكن أن تحتوي نصوص عربية عن طريق
local ar_Sa

https://github.com/fzaninotto/Faker

@AhmedElTabarani
Copy link
Author

AhmedElTabarani commented Jan 13, 2022

بالمناسبة Faker PHP يمكن أن تحتوي نصوص عربية عن طريق local ar_Sa

تم اضافتها كمرجع
لكن نريد شيء أفضل منه ويكون كيان خاص بالعربية فقط وايضا بالطبع يجب أن يكون له API يمكن استخدامه لتطوير مكاتب أخرى للغات البرمجة المختلفة لكي لا يكون مختصرة على لغة واحدة فقط كـ php او js ... الخ

@AhmedElTabarani
Copy link
Author

AhmedElTabarani commented Jan 13, 2022

يمكننا تطوير مصباح أكثر، هذه النسخة هى نسخة أولية ومازالت بها بعد الأخطاء، لكن وصلتني بعد الأفكار من خلال تويتر وجاري العمل عليها.

@schehata

مشروعك رائع قد يكون بداية الطريق ❤

يجب ان نراعي بعض الامور

  • يجب ان نوفر API له ليتمكن الاخرون من صنع مكاتب واضافات مبنية عليه
  • اخذ باعتبار تعليق @MuhammadSawalhy تعليق
  • ان امكن ان نجعله مفتوح المصدر ليتم تقديم مساهمات له

@schehata
Copy link
Contributor

نصوص ال lorem لابد ألا تكون جاذبة للمطلع عليها أن يقرأها ليفهم ما فيها، لكن يجب أن تكون مالئة للفراغ المخصص للنص موضحة شكل النص ولونه. ال Lorem تستخدم أكثر ما تستخدم في التصميم والنمذجة الأولية

يمكننا أن نضع نوع جديد من النص، يقوم فقط باظهار شئ ما مثل
lorem ipsum

حاولت البحث قليلًا عن فقرات عربية مشابهة، لكن لم يحالفني الحظ.

ما هى التغييرات التي تراها مناسبة حتى يملأ النص الفراغ اللازم ويظهر شكله.

@schehata
Copy link
Contributor

يمكننا تطوير مصباح أكثر، هذه النسخة هى نسخة أولية ومازالت بها بعد الأخطاء، لكن وصلتني بعد الأفكار من خلال تويتر وجاري العمل عليها.

@schehata

مشروعك رائع قد يكون بداية الطريق ❤

يجب ان نراعي بعض الامور

  • يجب ان نوفر API له ليتمكن الاخرون من صنع مكاتب واضافات مبنية عليه
  • اخذ باعتبار تعليق @MuhammadSawalhy تعليق
  • ان امكن ان نجعله مفتوح المصدر ليتم تقديم مساهمات له

أعمل على تجهيز ال API
لكن على أولًا أن أوفر سبل لحماية ال endpoints
وربما عمل API KEY
و Rate Limiting

@schehata
Copy link
Contributor

المكتبة نفسها التي تقوم بتوليد النصوص هى مكتبة مفتوحة المصدر كما ذكرت على موقع مصباح، ها هي:
https://github.com/linuxscout/Arrand-arabic-random-text

@MuhammadSawalhy
Copy link
Collaborator

MuhammadSawalhy commented Jan 18, 2022

ماذا عن مثل هذه النصوص العشوائية التي تبدو كالعربية دون معنى؟! وهو ما تمثله Lerom ipsum للغات ذات الحروف اللاتينية. فالـ Lorem هي نص لاتيني غيرت حروفه وعدلت كلماته حتى صار دون معنى في ذاته وهو ما يخدم الغاية التي أنشئ من أجلها، أن تكون مالئة للفراغ placeholder في التصاميم مثلا.

Lorem ipsum is typically a corrupted version of De finibus bonorum et malorum, a 1st-century BC text by the Roman statesman and philosopher Cicero, with words altered, added, and removed to make it nonsensical and improper Latin.

image

@schehata
Copy link
Contributor

schehata commented Mar 30, 2022

ماذا عن مثل هذه النصوص العشوائية التي تبدو كالعربية دون معنى؟! وهو ما تمثله Lerom ipsum للغات ذات الحروف اللاتينية. فالـ Lorem هي نص لاتيني غيرت حروفه وعدلت كلماته حتى صار دون معنى في ذاته وهو ما يخدم الغاية التي أنشئ من أجلها، أن تكون مالئة للفراغ placeholder في التصاميم مثلا.

Lorem ipsum is typically a corrupted version of De finibus bonorum et malorum, a 1st-century BC text by the Roman statesman and philosopher Cicero, with words altered, added, and removed to make it nonsensical and improper Latin.

image

إن كنت تعني الحروف فالصورة فهى ليست حروف عربية، فالأغلب فارسية أو إوردو ربما، لا أعلم. هذه اللغات تستخدم حروف اللغة العربية ولديهم حروف أخرى مثل الصورة بالأعلي، أعتقد الغرض منها هو دمج حروف من لغات أخرى مثل حرف P مثلًا، ليس موجودًا في العربي، فاستنسخوا حرف "الباء" من العربي ووضعوا تحته 3 نقط. (لست دارسًا للغات فغير متأكد من صحة معلوماتي، هو مجرد تخمين مني).

إن كان بإمكاننا الاتفاق على نص شبيه ب lorem ipsum (حتى لو مؤقت أو تجريبي) يمكنني وضعه في موقع مصباح. في الحقيقة إن كان النص ثابتًا سيعطي أداء أفضل ومعنى أقوى للخدمة. ويمكننا كتابة شرح للفرقة ومن أين أتينا بها وهكذا.

@MuhammadSawalhy
Copy link
Collaborator

@AhmedElTabarani
Copy link
Author

IMG_٢٠٢٢٠٥١٢_٠٣٥٩٤١.jpg

https://twitter.com/eng_kamal000/status/1524327865566867457?t=BPW0C0Xs945kgkw7Frlw3A&s=19

تم ذكره من بداية كتابتي لهذه الـ issue

@MuhammadSawalhy
Copy link
Collaborator

Bionic Reading for Arabic

https://www.facebook.com/iHesham/posts/10166391065090335

@schehata
Copy link
Contributor

هل ضفنا المزيد من المحتوى للموقع؟ لا أتذكر اخر خطوة وصلنا لها. كيف أساعد الآن؟

@AhmedElTabarani
Copy link
Author

هل ضفنا المزيد من المحتوى للموقع؟ لا أتذكر اخر خطوة وصلنا لها. كيف أساعد الآن؟

لا اعرف @MuhammadSawalhy

لمن بالنسبة لمشروع مصباح فهل يمكنك عمل API له لكي يستخدمه المبرمجين مثل ما يستخدمون Placeholder API

@schehata
Copy link
Contributor

@AhmedElTabarani نعم، ممكن جدًا. أعتقد اني قد قمت بتصميم ال API بالفعل.
ينقصني فقط عملي توثيق لكيفية الاستخدام، وربما عمل حماية او rate limiting. لكن ال API موجود على استضافة مجانية، لا أعلم أن كانت ستتحمل عدد كافي من ال requests.

@schehata
Copy link
Contributor

@AhmedElTabarani لقد قمت برفع الكود في مستودع خاص، بالإضافة إلى الواجهة نفسها وإضافة المتصفح. ينقصني أن أقوم بتوثيق طريقة الاستخدام
انظر هنا:
https://github.com/mesba7/api

@schehata
Copy link
Contributor

لكن يجب أن نفكر في طريقة لعمل deployment، كنت أقوم باستخدام الخطة المجانية من هيروكو، لكنهم أعلنوا أن إيقاف الخدمة المجانية، أعتقد نهاية هذا الشهر. سيتوقف موقع مصباح عن العمل.

@AhmedElTabarani
Copy link
Author

جرب cyclic.sh بديل سريع ومجاني لهيروكو

@MuhammadSawalhy
Copy link
Collaborator

هل ضفنا المزيد من المحتوى للموقع؟ لا أتذكر اخر خطوة وصلنا لها. كيف أساعد الآن؟

للأسف في هذه الفترة مشغول جدا، سأحاول العودة لمبادرة وغيرها من المشاريع قريبا إن شاء الله بعدما أخرج من بعض النشاطات التي تشغل وقتي.

@schehata
Copy link
Contributor

schehata commented Dec 5, 2022

جرب cyclic.sh بديل سريع ومجاني لهيروكو

لقد قمت بتحويل مصباح الى منصة Vercel. قد استغنيت عن netlify و heroku واكتفيت بvercel حيث أصبح ال API عبارة عن serverless functions

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants