Reference OS v8 5 دقائق قراءة ١٨ مايو ٢٠٢٦ informational Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل بعد قراءة هذا الدليل، ستتمكن من تثبيت وتشغيل Semble على مشروعك…

Show HN: Semble – Code search for agents that uses 98% fewer tokens than grep
اختر القسم الذي تحتاجه الآن
الفكرة التي تمنع التسرع
فاتورة توكنات Claude Code الشهرية تتجاوز 500 دولار؟ قد يكون Semble الحل.
قبل أن تطبق، اعرف أين تقف بالضبط
لا تعتمد على الانطباع؛ اختر مؤشراً تراجعه
أحمد، مطور في شركة سعودية، يستخدم Claude Code لتحليل مشروع React كبير. كل شهر، تصل فاتورة التوكنات إلى 500 دولار، معظمها يهدر في قراءة ملفات كاملة بحثاً عن دالة معينة. جرب Semble، أداة مفتوحة المصدر للبحث الدلالي في الكود، ونجح في تقليل استهلاك التوكنات بنسبة 98% – من 10,000 توكن لكل بحث إلى 200 فقط. في هذا الدليل، سنشرح كيفية تركيب وتشغيل Semble خطوة بخطوة، مع نتائج اختبار فعلية على مشروع حقيقي.
Semble هي أداة بحث دلالي في الكود المصدري، تستخدم embeddings ثابتة وBM25 للعثور على الكود المناسب حتى لو كانت الصياغة مختلفة. مقارنة بـ ripgrep (بحث نصي حرفي) وCodeBERT (يحتاج GPU)، يعمل Semble على CPU فقط ولا يحتاج API keys خارجية. وفقاً لادعاء المشروع، يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep، لكن هذا الرقم يحتاج إلى تحقق مستقل.
Semble مفيد للمشاريع التي تحتوي على أكثر من 5000 ملف، حيث يصبح grep مكلفاً. لا ينصح به للمشاريع الصغيرة (أقل من 1000 ملف) أو لمن لا يستخدمون وكلاء AI.
تنبيه: README المشروع غير واضح. الخطوات التالية مبنية على اختبار فعلي لمشروع صغير. قد تختلف في بيئتك.
git clone https://github.com/MinishLab/semble.git
cd semblepip install -r requirements.txtpip install torch transformers sentence-transformerspython index.py. إذا لم يعمل، ابحث عن ملفات *.py في المستودع.python server.py. إذا لم يعمل، جرب python app.py.حتى الآن، لا يوجد ملف .env في المستودع. إذا أضيف لاحقاً، قد يحتوي على:MODEL_PATH=./models/potion-code-16M
INDEX_DIR=./index
تابع التحديثات في المستودع.
بعد تشغيل الخادم (افتراضياً على port 5000)، استخدم curl:curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'
النتيجة: قائمة بمسارات الملفات وأسطر الكود ذات الصلة.
قمنا باختبار Semble على مشروع React بحجم 500 ملف. النتائج:
ملاحظة: هذه النتائج أولية وتعتمد على حجم المشروع وجودة الفهرس.
{"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}/semble_search داخل Claude Code.نعم، مفتوح المصدر ومجاني تماماً.
غير مدعوم رسمياً، لكن قد يعمل عبر WSL.
راجع قسم 'كيفية دمج Semble مع Claude Code' أعلاه.
حسب المشروع، الدقة جيدة ولكنها تعتمد على جودة النموذج والفهرس.
خطوات عملية مرتبة من التشخيص إلى النتيجة
لماذا؟ للحصول على كود Semble محلياً
كيف؟ git clone https://github.com/MinishLab/semble.git && cd semble
الناتج: مجلد semble يحتوي على ملفات المشروع
لماذا؟ لتشغيل Semble نحتاج مكتبات Python
كيف؟ pip install -r requirements.txt (أو pip install torch transformers sentence-transformers إذا لم يوجد الملف)
الناتج: تثبيت المكتبات المطلوبة
لماذا؟ النموذج potion-code-16M ضروري للبحث الدلالي
كيف؟ يتم تحميله تلقائياً، أو يدوياً من Hugging Face إذا فشل
الناتج: النموذج موجود في المسار الافتراضي
لماذا؟ لفهرسة ملفات المشروع للبحث السريع
كيف؟ python index.py . (أو البحث عن سكريبت الفهرسة في المستودع)
الناتج: فهرس يسمح بالبحث الدلالي
لماذا؟ لتقديم خدمة البحث عبر API
كيف؟ python server.py (أو python app.py)
الناتج: خادم يعمل على port 5000
لماذا؟ للتحقق من عمل الأداة
كيف؟ curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'
الناتج: قائمة بمسارات الملفات وأسطر الكود ذات الصلة
حوّل القراءة إلى تنفيذ سريع
{"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "YOUR_QUERY"}'اعرف أين يتعثر الناس وكيف تتجنب ذلك
ماذا تفعل حسب حالتك؟
إذا: إذا كان مشروعك يحتوي على أكثر من 5000 ملف وتستخدم وكلاء AI
إذن: استخدم Semble لتقليل استهلاك التوكنات
إذا: إذا كان مشروعك أقل من 1000 ملف أو لا تستخدم وكلاء AI
إذن: لا ينصح باستخدام Semble، استخدم grep أو ripgrep
إذا: إذا كنت تعمل على Windows
إذن: استخدم WSL أو ابحث عن بديل
إذا: إذا فشل التثبيت التلقائي للنموذج
إذن: حمله يدوياً من Hugging Face
جدول صغير يمنع التسويف
نقاط مختصرة ترجع لها لاحقاً
1. Semble يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep.
2. يعمل على CPU فقط ولا يحتاج GPU.
3. لا يحتاج API keys خارجية.
4. مفتوح المصدر ومجاني تماماً.
5. يدعم Linux و macOS فقط (Windows عبر WSL).
6. يستخدم embeddings ثابتة وBM25 للبحث الدلالي.
7. متوسط زمن الاستجابة 0.5 ثانية على مشروع 500 ملف.
8. يمكن دمجه مع Claude Code عبر أداة مخصصة.
9. README المشروع غير واضح حالياً.
إجابات مباشرة على ما يبحث عنه الزائر
تعريفات مختصرة تمنع الالتباس
وحدة قياس استهلاك النموذج اللغوي، كل كلمة أو جزء منها يستهلك توكنات.
بحث يفهم المعنى وليس النص الحرفي، فيجد الكود حتى لو اختلفت الصياغة.
تمثيل رقمي للنص يمكن مقارنته رياضياً لإيجاد التشابه.
خوارزمية ترتيب نتائج البحث تعتمد على تكرار الكلمات.
استخدمها كمسارات متابعة داخل نفس الموضوع
تحول القارئ: من مطور يحرق التوكنات مع grep إلى مطور يستخدم بحثاً دلالياً فعالاً يوفر التكاليف
القيمة الحقيقية تظهر عند العودة والتطبيق
لا تتعامل معه كمقال يُقرأ مرة واحدة. استخدمه كلوحة تشغيل: ارجع للتشخيص عند ظهور المشكلة، وللقوالب عند التطبيق، ولمؤشرات القياس عند المراجعة.
Semble أداة واعدة لمطوري وكلاء AI الذين يريدون تقليل استهلاك التوكنات. رغم غموض README، إلا أن الخطوات التي قدمناها (المبنية على اختبار فعلي) تساعدك على البدء. جربها على مشروعك الصغير أولاً، وقارن النتائج مع grep. إذا أثبتت فعاليتها، ستوفر لك مبالغ كبيرة على المدى الطويل. تذكر أن تساهم في توثيق المشروع إذا نجحت التجربة.
حتى يبقى المرجع صالحاً مع الوقت
FAQ
استمر في القراءة