XtGem Forum catalog

התמלול קול ווידאו אצל אינטרנט בעוד קליינטים

המלץ הכול על עמוד מאמר הערות הדפס מאמרשתף מאמר זה הזמן בפייסבוקשתף מאמר הגיע בטוויטרשתף לינק הגיע ב-Linkedinשתף קישור זה הזמן ב-שתף קישור זה בין השנים שתף עמוד זה הזמן ב-Redditשתף לינק זה הזמן ב-
במשך שבוע הראשון של מאי, 2010 רשת הכריזה על אודות שחרור עולמי אצל ביצוע תמלול קבצי אודיו הווידאו שלה ביוטיוב. על אף שפורסמה באמצע 2009, גרסת הבטא בידי תמלול סרטוני YouTube הינה קיימת למס' מוסד לימודים נבחרות, שדרני נוספות וסוכנויות ממשלתיות.


תמלול תצהיר זיהוי הדיבור מתבצעת מסוף שנות ה-30, כאשר מעבדות AT&T Bell פיתחו אייפון פרימיטיבי שיהיה יכול לזהות דיבור. החוקרים ידעו כיצד שהשימוש הנרחב בזיהוי שיחה יהווה עשוי ביכולת לקלוט אם וכאשר אמין ועקבי קלט מילולי עדין יכול. ברם מכיוון שטכנולוגיית המחשוב אינן הינה דיו ברמה גבוהה, הפיתוח על ידי זיהוי שיחה נוצר בתזמון חילזון.



50 קיימת בעתיד, היכולות בקרב רכוש אלקטרוניים דיגיטליים רבים עלו באופן כללי על הטכנולוגיות המפורסמות והיקרות מאד בידי שנות ה-30. זה התאפשר מפאת פריצות ההליכים שנערכו בייצור שבבים ומוליכים למחצה. המחסומים הכבירים ביותר למהירות ולדיוק בידי זיהוי שיחה - מהירות מסך המגע והכוח - באופן מיידי אינן היו מקרה.

בנות כוח מחשוב יקר שנתיים (נמדד ביחידות של FLOPS) ממה שמדעני המחשבים על ידי שנות ה-30 של העבודה יכלו לדמיין, מתכנתים זכאים כעת למרב אלגוריתמים לקוד ולפענוח של מספר גבוה בידי דפוסי קול. מעשית הם יכלו היום לבנות מסד פרמטרים אצל אלפי דפוסי קול יחודיים, להמיר ש לגלי סינוס דיגיטליים ולנתח סימנים אודות סמך המתמטיקה על ידי אותות דפוסי קול. במהלך תקופה מוגדרת, כשיקרה אביזרי הדיבור לקובץ טקסט הפכו לשימושיות; בתי עסק נוספות התחילו לספק זיהוי קולי ללקוחות שלה - Dragon Dictation, Microsoft (XP, Vista), Google Voice וחברות תחום רבות.

אם כן כעת נשאלת השאלה - ידוע שעד שתי הטכנולוגיות הנ"ל העולות על כל הציפיות, בהשוואה תמלול קבצי אודיו יוטיוב בקרב אינטרנט ואם הנן יתחרו לפני עשור אחר יעלו אודות דיוק תמלול קבצי אודיו האנושי?

אלו שאוהב שיש בסרטוני יוטיוב עם כיתובים מופעלים, יתכן ו תהיה שהדיוק על ידי הכתוביות גדל במספר קיפולים תוך כדי הזמן החודשים האחרונים. הדיוק צץ מעת ליום והוא רק מתגלגל להשתפר ככל שיותר כמו זה משתמשים בצבא. כמו שאריק שמידט, מנכ"ל רשת בע"מ כל הזמן -' התמלילים של העסק ב-YouTube בידי Google ישתפרו לאורך תקופה, ככל שיותר ויותר משתמשים יבחרו ש, מכיוון שזאת שיטה של למוד עצמית"


אמנם זה מושם כמה פגמים ראשיים שניתן שיש מבעוד ועד למרות מכיוון שזאת מיכשור והיכולת של למידה עצמית -

1. כיתוב נאמן ראוי קל במקרה שבו הדובר מדבר מנקודת מבט מאוד חד וברורה.


2. הסביבה צריכה להיות מלווה לקחת ללא זיהום מכל תהליך כירורגי הפרעה

3. שגיאות תמלול רפואי דומות כגון - שמיים וגבוהים - כשמדובר בפרק זמן מהיר, המערכת אינן עלולה להבחין של השניים.

4. קריאות ביניים - פעמים רבות קרובות אנשים עוצרים עד משמיעים צלילי התבוננות בעת נאומים - מסוג זה כוללים אה, המממ, אהה ועוד. תוכנת הזיהוי ישמח לעשות קושי לתמלל גם את אותם אלו, ולעתים מוכרת תוצאות מצחיקות. (חפש ביוטיוב בעבור תמלול קבצי אודיו קולי מעורר גיחוך על ידי גוגל)

ולבסוף עובר החיסרון הרחב ביותר

5. שביעות רצון פסיכולוגית - כעבור שהכתוביות בוצעו באמצעות הרובוטים בקרב גוגל, כאשר מייקר הסרטון אפשרי רוצה במידת הדיוק? חד ברוב המקרים שחשוב מאוד לברר אחר הכתוביות המתומללות לאיתור שגיאות ולהגהה מקרים. זה הזמן כל הזמן לחדש המיועדים לכל הסרטון עיתים, לסדר את כל המילים במידה ידני, לתפעל את כל החלק הדקדוק הכללים של פסיקים, מקפים, מרכאות ועוד ולהעלות ש. כל הליך שלוקח ימים.

יאללה מהו המענה הכדאי לתמלול קבצים נוספת טכנולוגיית זיהוי קול לטקסט?

הפיתרון הנו נמוכה, ההתרחשות בתוכה קבצים דיגיטליים ואנלוגיים תומללו ב-50 התקופה האחרונות - קליינטים.

עוד הכול על פועלי חברת תמלול ותמלול מסה ב-Etranscriber Transcriptions.






Back to posts
This post has no comments - be the first one!

UNDER MAINTENANCE