כללי גרפ לצוד כל לועזית כולל גליפים מיוחדים של שפות אקזוטיות...

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
שלום!
משהו יודע גרפ נח ויעיל יותר מאשר זה?
קוד:
([[=Q=]]|[[=W=]]|[[=E=]]|[[=R=]]|[[=T=]]|[[=Y=]]|[[=U=]]|[[=I=]]|[[=O=]]|[[=P=]]|[[=A=]]|[[=S=]]|[[=D=]]|[[=F=]]|[[=G=]]|[[=H=]]|[[=J=]]|[[=K=]]|[[=L=]]|[[=Z=]]|[[=X=]]|[[=C=]]|[[=V=]]|[[=B=]]|[[=N=]]|    [[=M=]]|[[=q=]]|[[=w=]]|[[=e=]]|[[=r=]]|[[=t=]]|[[=y=]]|[[=u=]]|[[=i=]]|[[=o=]]|[[=p=]]|[[=l=]]|[[=k=]]|[[=l=]]|[[=Z=]]|[[=X=]]|[[=C=]]|[[=V=]]|[[=B=]]|[[=N=]]|[[=M=]])+
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
תשתמש ביוניקוד.
הגם שאני לא מכיר את מה שהעלאת לכאן.
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
נכתב ע"י ונתנו10;1493664:
תשתמש ביוניקוד.
הגם שאני לא מכיר את מה שהעלאת לכאן.

מהיכן אדע כל היוניקוד של השפות הנ"ל? :(

מה שעשיתי הוא פשוט וברברי...
כתוב בעזרה של אינדזיין ככה:
[[==a==]] מוצא כל הסט של הa כולל a עם נקודות על הראש ומכל הכיונים...

אז עשיתי סט כזה של כל הABC ושמתי בתוך ()+ עם | מפרידים.

בתחילה ניסיתי [[[==a==]]-[[==z==]] [[[==A==]]-[[==Z==]]]
אבל לא עבד משום מה
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
השאלה מה עוד מוצא מה שכתבת. ולמתי זה יבוא לידי שימוש.
ואפשר להבין למה המקף הרס, כי זה הפך אותו לסדרה, כמו א-ו שזה מא' עד ו'.
היית יכול לוותר עליהם וזה היה עובד מצויין.
 

DMD

משתמש פעיל
עימוד ספרים
אולי אני לא מבין מה אתה רוצה לעשות... אבל,
במקום לחפש כל תו לועזי, למה לא לחפש הכל חוץ מתווי עברית?
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
אין לי מושג באיזה שפות אתה מתעסק, אך לגבי שאלתך, לכאורה זה יספיק לך:
קוד:
[a-ԝ]+
(זה לא W אלא אות אחרת)
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
נכתב ע"י ונתנו10;1493745:
אין לי מושג באיזה שפות אתה מתעסק, אך לגבי שאלתך, לכאורה זה יספיק לך:
קוד:
[a-ԝ]+
(זה לא W אלא אות אחרת)
נ"ב- A היא קודמת לa
כך שזו מחרוזת לא נכונה

נ"ב שני: בטעות מחקתי התוכן שכתבתי כאן מקודם במקום להוסיף, כך שתגובתך בהמשך נראית בגלל זה לא מובנת, מחילה.
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
פתחתי את חלון הגליפים ובחרתי באחרון מהשפות הלטיניות (זה לא כולל ערבית לדוגמה).
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
בנתיים פתחתי את הטבלה הזאת:
http://unicode-table.com/en/#0370
והגעתי למסקנה שהחיפוש הזה טוב לכל השפות הלטיניות (ללא הקריליות).
[A-ʸ]
ולשם תפיסת רווח וגרשיים וכו בתוך האנגלית וצמוד אליה אני משתמש בזה:
[\"']*[A-ʸ]+([^א-ת]+[A-ʸ]+)*[\"']*
מה דעתך?
מכיר משהו טוב יותר?
(עיקר השאלה היא לגבי רווחים וגרשים שזה נוגע לכל חיפוש אנגלית גם הרגיל של[A-z])
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
כעת מצאתי ההבדל בין החיפוש של אינדזיין "כל תו(any later)" לחיפוש הזה:[A-Za-z]
בזה שהוא מוצא גם תווים מוזרים!
וצריך:
[\"']*[\l\u]+([^א-ת]+[\l\u]+)*[\"']*

ומה שהצעתי קודם, מצאתי חיסרון, שהסט הזה כנראה כולל גם סוגריים מרובעים (חלק מהם לפחות...) וגם רווחים קשיחים!

וזה לא בגלל התוספת של התוים המיוחדים שהוספתי אלא גם המחרוזת הזו לבד מוצאת ככה:[A-z]+
כנראה אין רצף בין האABC הגדול והקטן, ובאמצע מסתתרים כמה סמנים פיסוק שונים,(לא כולם..) (אפשר למצוא מה הם על ידי חיפוש כזה[Z-a])
ואם לא רוצים ה[\l\u] אז לאנגלית רגילה צריך [A-Za-z] ואי אפשר לקצר ל[A-z]



טקסט מוזר לדוגמה:
Sužiedėlis, “The Historical Sourc
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
נכתב ע"י eliezer;1495245:
ואי אפשר לקצר ל[A-z]
מה שכתבת לא אפשרי, כי תו A גדולה נמצא ברשימה אחרי z קטנה.
ולכן אם תרצה לחפש כל תו אנגלי תוכל לעשות את זה ע"י [a-Z] אבל קח בחשבון שישנם כמה תווים נוספים שימצא (כי תו A גדולה לא נמצאת ישר אחרי z לפי סדר יוניקוד)
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
נכתב ע"י eliezer;1495208:
מה דעתך?
מכיר משהו טוב יותר?
לא יודע אם טוב יותר, אבל נראה לי שאפשר לקצר את אורך השורה קצת.
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
נכתב ע"י ונתנו10;1495329:
מה שכתבת לא אפשרי, כי תו A גדולה נמצא ברשימה אחרי z קטנה.
ולכן אם תרצה לחפש כל תו אנגלי תוכל לעשות את זה ע"י [a-Z] אבל קח בחשבון שישנם כמה תווים נוספים שימצא (כי תו A גדולה לא נמצאת ישר אחרי z לפי סדר יוניקוד)

הפוך במחילה
החיפוש הזה [A-z] ימצא כל הלועזית וגם קצת באמצע עוד כמה תווים שונים
ואילו החיפוש הזה:
[a-Z] לא ימצא כלום כי a בא אחרי Z
 

קבצים מצורפים

  • א.PNG
    KB 38.3 · צפיות: 10
  • ב.PNG
    KB 30.1 · צפיות: 14

אריאל וו

משתמש סופר מקצוען
עיצוב גרפי
מוזיקה ונגינה
עימוד ספרים
לרוב אין צורך בגרעפ כזה, כי למרבה המזל כשמקלידים בוורד באותיות לטיניות, השפה משתנה בהתאם בצורה אוטומטית. ולכן אפשר באינדיזיין פשוט לחפש את שפת האנגלית למיניו.
 

אריאל וו

משתמש סופר מקצוען
עיצוב גרפי
מוזיקה ונגינה
עימוד ספרים
בכל אופן, לשאלתך, הדרך הפשוטה היא זו:

קוד:
[\u\l]

:)
 

ונתנו10

משתמש מקצוען
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי DIP
D I G I T A L
כמובן. זה אשכול לחידודי בעלמא :)
 

eliezer

מהנדס בינה מלאכותית
מנוי פרימיום
בוגר/תלמיד פרוג
עיצוב גרפי
עימוד ספרים
הנדסת תוכנה
D I G I T A L
נכתב ע"י אריאל וו;1496415:
בכל אופן, לשאלתך, הדרך הפשוטה היא זו:

קוד:
[\u\l]

:)
זה מה שכתבתי בעצם במסקנה רק הוספתי תוספות לחיפוש תווים נספחים. לעיצוב אחיד.


למה לחידודי בעלמא?! זה מקרה מעשי מאד שנתקלתי במילים בפולנית או משהו כזה בספר
 

אולי מעניין אותך גם...

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק קכו

א שִׁיר הַמַּעֲלוֹת בְּשׁוּב יי אֶת שִׁיבַת צִיּוֹן הָיִינוּ כְּחֹלְמִים:ב אָז יִמָּלֵא שְׂחוֹק פִּינוּ וּלְשׁוֹנֵנוּ רִנָּה אָז יֹאמְרוּ בַגּוֹיִם הִגְדִּיל יי לַעֲשׂוֹת עִם אֵלֶּה:ג הִגְדִּיל יי לַעֲשׂוֹת עִמָּנוּ הָיִינוּ שְׂמֵחִים:ד שׁוּבָה יי אֶת (שבותנו) שְׁבִיתֵנוּ כַּאֲפִיקִים בַּנֶּגֶב:ה הַזֹּרְעִים בְּדִמְעָה בְּרִנָּה יִקְצֹרוּ:ו הָלוֹךְ יֵלֵךְ וּבָכֹה נֹשֵׂא מֶשֶׁךְ הַזָּרַע בֹּא יָבוֹא בְרִנָּה נֹשֵׂא אֲלֻמֹּתָיו:
נקרא  104  פעמים

אתגר AI

קוביסט • אתגר 144

לוח מודעות

למעלה