מישהו מכיר דרך לבדוק כפילויות במסמך וורד?

rutt

משתמש מקצוען
יש לי מסמך וורד ארוך מאד, ואני חוששת שבמקומות מסוימים סיפור מסוים או רעיון מסוים בא בכפילות.
השאלה שלי האם ישנה דרך כלשהי [מבלי לדעת מראש מה הטקסט הכפול] להעביר סריקה שבה ניתן יהיה לדעת האם יש טקסטים כפולים? [חייב להיות מדובר באפשרות לבחור את אורך הטקסט, שהרי לא יעלה על הדעת שהוא ימצא מילים בודדות "כפולות"...]
 

tkh

משתמש מקצוען
עימוד ספרים
עריכה תורנית
אינני מומחה גדול, אבל ניתן לעשות מאקרו שיעבור לפסקה הבאה, יסמן את כולה ויעתיק ללוח, ובחיפוש להדביק את תוכן הלוח ולמצוא אם הוא נמצא שוב מכאן ואיך (חיפוש לכיוון מטה).
לעשות למאקרו מקש קיצור קל ופשוט לעבור אחד אחד. (כמה פסקאות יש בקובץ?)

אם יודעים שפת VB (שאינני יודע כלל), אפשר מן הסתם לעשות תנאי שאם התוצאה של החיפוש 0 יחזור שוב על המאקרו, ואם מצא פסקה דומה יעצור.
 

rutt

משתמש מקצוען
אינני מומחה גדול, אבל ניתן לעשות מאקרו שיעבור לפסקה הבאה, יסמן את כולה ויעתיק ללוח, ובחיפוש להדביק את תוכן הלוח ולמצוא אם הוא נמצא שוב מכאן ואיך (חיפוש לכיוון מטה).
לעשות למאקרו מקש קיצור קל ופשוט לעבור אחד אחד. (כמה פסקאות יש בקובץ?)

אם יודעים שפת VB (שאינני יודע כלל), אפשר מן הסתם לעשות תנאי שאם התוצאה של החיפוש 0 יחזור שוב על המאקרו, ואם מצא פסקה דומה יעצור.

תודה.
מדובר בקובץ בן 2600 עמודים...
או שהמעבד יישרף או שהמחשב ייתקע...
בצחוק...
אבל נראה לי שזו פעולה ארוכה מאד מאד... חיפוש פשוט בכזה מסמך לוקח זמן... כל שכן לעשות כך על אלפי פסקאות?
 

rutt

משתמש מקצוען
ראיתי שמישהו כתב כאן משהו -
https://stackoverflow.com/questions...-phrases-in-a-word-document?noredirect=1&lq=1

רק שיש שם קצת בלגן, מישהו שמבין בקוד יכול לומר לי מה אמור לעבוד שם?
וכן באיזה מהם יש אפשרות לשלוט בגודל המשפט [מספר המלים] שרק בו יחפש כפילויות?

אני כעת רואה עוד שני פוסטים שעוסק בענין
https://stackoverflow.com/questions...epeat-sentences-or-phrases-in-a-word-document

וזה נראה שעוסק בצורה יותר מובהקת בפסקאות שלימות:
https://www.extendoffice.com/documents/word/5450-word-find-duplicate-sentences.html
 

rutt

משתמש מקצוען
ניסיתי את האחרון מביניהם, והוא עובד מצוין!
הבעיה רק שהוא מזהה פיסקאות שלימות, ולא רצף מילים.
אני מעדיפה משהו שיזהה רצף מילים לפי מספר קבוע מראש - שבידי תהיה האפשרות לקבוע לדוגמא שרק רצף של לפחות 10 מילים - יסומן ככפילות.

לטובת חברי הפורום העליתי לכאן את הקוד שלהם:

PHP:
Sub highlightdup()
    Dim I, J As Long
    Dim xRngFind, xRng As Range
    Dim xStrFind, xStr As String
    Options.DefaultHighlightColorIndex = wdYellow
    Application.ScreenUpdating = False
    With ActiveDocument
        For I = 1 To .Paragraphs.Count - 1
            Set xRngFind = .Paragraphs(I).Range
            If xRngFind.HighlightColorIndex <> wdYellow Then
                For J = I + 1 To .Paragraphs.Count
                    Set xRng = .Paragraphs(J).Range
                    If xRngFind.Text = xRng.Text Then
                        xRngFind.HighlightColorIndex = wdBrightGreen
                        xRng.HighlightColorIndex = wdYellow
                    End If
                Next
            End If
        Next
    End With
End Sub
 

Rרחמים

משתמש סופר מקצוען
עיצוב גרפי
איור וציור מקצועי
מוזיקה ונגינה
עריכה תורנית
D I G I T A L
עימוד ספרים
@rutt פשוט מאד:
  1. להעתיק את המסמך לאקסל
  2. כל פיסקה תכנס לתא בפני עצמו
  3. ולהסיר כפילויות
  4. אם ימצאו כפילויות הרי זה הסימן שהיו כפילויות
אפשר בעמודה שליד כל הפיסקאות לעשות מספור רציף, וכאשר יוסרו הכפילויות נדע בקלות איזה מספר פיסקה הייתה כפולה.
 

rutt

משתמש מקצוען
@rutt פשוט מאד:
  1. להעתיק את המסמך לאקסל
  2. כל פיסקה תכנס לתא בפני עצמו
  3. ולהסיר כפילויות
  4. אם ימצאו כפילויות הרי זה הסימן שהיו כפילויות
אפשר בעמודה שליד כל הפיסקאות לעשות מספור רציף, וכאשר יוסרו הכפילויות נדע בקלות איזה מספר פיסקה הייתה כפולה.

תודה.
יש בכך גם פתרון למה שביקשתי - תהיה אפשרות לבחור אורך משפטים כפולים? או רק פסקאות.
 

Rרחמים

משתמש סופר מקצוען
עיצוב גרפי
איור וציור מקצועי
מוזיקה ונגינה
עריכה תורנית
D I G I T A L
עימוד ספרים
אורך אי אפשר לבחור, ובפרט שכאשר אומרים אורך מתכוונים שהאורך הזה יתחיל מהמילה הראשונה ויעבור בדיקה ושוב יתחיל מהמילה השניה ויעבור בדיקה וכו' וכו', לזה צריך כבר תוכנה שתעשה את זה.
 

rutt

משתמש מקצוען
אורך אי אפשר לבחור, ובפרט שכאשר אומרים אורך מתכוונים שהאורך הזה יתחיל מהמילה הראשונה ויעבור בדיקה ושוב יתחיל מהמילה השניה ויעבור בדיקה וכו' וכו', לזה צריך כבר תוכנה שתעשה את זה.

תודה.
אף אחד מהמקורות שהבאתי לעיל לא אמור לעשות את זה?
 

יעקוב ישראל

משתמש רשום
עריכה תורנית
אני צריך למצוא כפילויות במסמך וורד, אבל לא למחוק אותן אלא לסמן אותן.
יש כזו אפשרות?
עם בינה מלאכותית?
 

יעקוב ישראל

משתמש רשום
עריכה תורנית
בינתיים ראיתי שאפשר עם אחד הקודים שהובאו למעלה, אבל זה הקריס לי את הוורד.
 

בינלאומי

משתמש חדש
תכניס לאקסל, אימות נתונים
תצבע את הכפול בצבע שונה

אתה כול שכל קטע או כל פיסקה יכנס לתא נפרד
תעשה בוורד החלפה של כל נקודה לנקודה + מעבר שורה
 

אולי מעניין אותך גם...

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק קמט

א הַלְלוּיָהּ שִׁירוּ לַיהוָה שִׁיר חָדָשׁ תְּהִלָּתוֹ בִּקְהַל חֲסִידִים:ב יִשְׂמַח יִשְׂרָאֵל בְּעֹשָׂיו בְּנֵי צִיּוֹן יָגִילוּ בְמַלְכָּם:ג יְהַלְלוּ שְׁמוֹ בְמָחוֹל בְּתֹף וְכִנּוֹר יְזַמְּרוּ לוֹ:ד כִּי רוֹצֶה יְהוָה בְּעַמּוֹ יְפָאֵר עֲנָוִים בִּישׁוּעָה:ה יַעְלְזוּ חֲסִידִים בְּכָבוֹד יְרַנְּנוּ עַל מִשְׁכְּבוֹתָם:ו רוֹמְמוֹת אֵל בִּגְרוֹנָם וְחֶרֶב פִּיפִיּוֹת בְּיָדָם:ז לַעֲשׂוֹת נְקָמָה בַּגּוֹיִם תּוֹכֵחֹת בַּלְאֻמִּים:ח לֶאְסֹר מַלְכֵיהֶם בְּזִקִּים וְנִכְבְּדֵיהֶם בְּכַבְלֵי בַרְזֶל:ט לַעֲשׂוֹת בָּהֶם מִשְׁפָּט כָּתוּב הָדָר הוּא לְכָל חֲסִידָיו הַלְלוּיָהּ:
נקרא  20  פעמים

לוח מודעות

למעלה