بهترین معادل فارسی Big Data کدام است؟
در نظر فرهنگستان زبان و ادب فارسی «علمآموزی به زبان بیگانه بسیار دشـوارتر از علمآموزی به زبان مادری است، زیرا درک ظرایف و پیچیدگیهای زبان بیگانه میسر نیـست مگر با صرف وقت و هزینۀ بسیار. ازاین رو، اگر علم به زبان بیگانـه تـدریس شـود، کـسانی بیشترین بهره را از آن خواهند برد که بر آن زبان مسلط باشند. بـه ایـن ترتیـب، فاصـلۀ میـان تحصیلکردگان و مردم عادی بیشتر میشود و اشاعۀ دانش محـدود مـیگـردد و در جامعـه تبعیضی سخت ناروا پدید میآید.»
فرهنگستان معادل مهواژه را برای BigData معین کرده است ولی متاسفانه این معادل مصطلح نشده و کاربرد فراگیر پیدا نکرده است. در نبود معادل استاندارد و مصطلح، چطور این اصطلاح را ترجمه کنیم؟ بزرگداده؟ کلانداده؟ دادههای بزرگ؟ دادههای کلان؟ عدم انتخاب و استفاده از یک معادل استاندارد چه هزینهای برای ما خواهد داشت؟
معادل فارسی کلمه Utopia چیست؟ آرمانشهر؟ مدینهی فاضله؟ ناکجاآباد؟ مشخص است که صاحبنظران هنوز اجماعنظر پیدا نکردهاند. این چندگانگی در انواع گونههای کاربردی زبان فارسی به شیوههای مختلفی نمود میکند. در زبان کوچهوبازار البته این اثر آنچنان محسوس نیست. اما در گونههای علمی زبان این چندگانگی اثر بسیار مخربی دارد. اگر نویسنده در متنی فلسفی عبارت مدینهی فاضله را برگزیده باشد، شما در جستوجو با کلیدواژهی آرمانشهر نتیجهای نخواهید یافت. (بحث کلمات معادل و چگونگی استخراج و برخورد با آنها در پردازش زبان طبیعی، بحث دیگری است.)
این آثار مخرب با بررسی ماهیت زبان علم که البته زبان رایانه را نیز در بر میگیرد، مشخصتر میشود. به گفته فرهنگستان «نقش اصلی زبان علم اطلاعرسانی است نه زیباییآفرینی و بیان عاطفی. از همین رو، زبان علم ترجمهپذیرترین گونه زبانی است». بنابراین ملاحظات زیباییشناختی نقش مهمی در تصمیم ما ایفا نمیکنند. فرهنگستان در جای دیگری میگوید «در زبـان علـم، بـرای انتقـال درسـت مفـاهیم، بایـد از واژههـای تثبیت شدهای بهره گرفت که همه جا نزد گوینده و مخاطب معنی مـشترکی داشـته باشـد.» کلمه Irreversible را در نظر بگیرید: تنها در علم شیمی از معادلهایی مانند «برگشتناپذیر»؛ «غیربازگشتنی»؛ «یکطرفه»؛ «یکطرفی»؛ «وانگَشتَنی»؛ «بازگـشتناپـذیر»؛ «ناواگَـشتَنی»؛ «یکجانبه»؛ «یکجهتی» و «نابرگشتنی» استفاده شده است. اضافه بر این، در زبان رایانه به دلیل تعدد باورنکردنی اصطلاحات، باید گاه به کل از ترجمه خودداری کرد و در غیر این صورت معادل استانداردی برگزید تا از لجام گسیختگی متون علمی و فنی رایانهای به زبان فارسی جلوگیری شود.
دستهای دیگر از ملاحظات بسیار مهم، ملاحظات دستوریاند. اصطلاح Big Data برخلاف کلمه Data در ترکیبهای دستوری شرکت فعالی ندارد. شما بسیار میشنوید Sale Data یا Obfuscated Data. ولی هرگز با عبارتی مانند Big Sale Data برخورد نمیکنید. از این رو Big Data را نمیتوان با کلمهای مانند «گلخانه» مقایسه کرد تا بگوییم بهتریم معادل آن «کلانداده» است. اگر از «خانهی گل» به جای «گلخانه» استفاده می کردیم دیگر نمیتوانستیم صفت «گلخانهای» را تولید کنیم و در نتیجه ترکیب «گازهای گلخانهای» را از دست می دادیم ولی در مورد Big Data اینگونه نیست. پس دلیلی برای تولید کلماتی جدید مانند «کلانداده» یا «بزرگداده» وجود ندارد. ما هرگز از «کلاندادههای اینترنتی» صحبت نخواهیم کرد.
انتخاب دیگر ما استفاده از گروههای نحوی است. عباراتی مانند «فاصلهی کانونی» یا «حرکت وضعی» یا «قهوهی فوری». البته در مورد گروههای نحوی باید این نکته را در نظر داشت که چنین اصطلاحاتی را نمیتوان یه سهولت در فرآیندهای ترکیبی و اشتقاقی به کار برد ولی این مسئله در مورد Big Data ما را آزار نمیدهد. استفاده از عبارت «دادههای کلان» یا «دادههای بزرگ» مسبوق به سابقه در عباراتی مانند «آموزش از راه دور» است.
با استفاده از عبارت «دادههای بزرگ»، به دلیل پرکاربرد بودن صفت «بزرگ»، عبارت در متن فارسی از هم گسیخته و به صورت ترکیبی روزمره از صفت و موصوف مانند «چرخ بزرگ» یا «اسب سفید» به نظر میآید. دقت کنید که عبارت انگلیسی Big Data با عبارت فارسی «دادههای بزرگ» قابل مقایسه نیست. در انگلیسی شما با عباراتی مشابه و مصطلح مانند Big Government یا Big Farma برخورد میکنید که به چشم خواننده آشنا می آیند و قابل مقایسه با عباراتی مانند Big Chair نیستند.
با در نظر گرفتن توصیههای فرهنگستان زبان و ادبیات فارسی، بهترین انتخاب در ترجمه Big Data «دادههای کلان» به نظر میرسد. با فراگیری روزافزون کاربرد دادههای کلان در تحلیل و استخراج روابط نهفته میان رفتار ما در فضای مجازی و علائق و جهتگیریهای شخصیمان؛ توافق روی معادل فارسی این اصطلاح و تثبیت آن در متون فنی و غیرفنی باعث اشاعه فرهنگ آگاهی در عموم کاربران ایرانی اینترنت می شود و مقدمهای خواهد بود بر پرداختن به مسائل مهمتری مانند حریم خصوصی و حقوق فردی در فضای آنلاین.
منابع:
فرهنگستان زبان و ادب فارسی، اصول و ضوابط واژهگزینی،
http://persianacademy.ir/UserFiles/File/OSOUL/310488.pdf
واژگان شیمی و مهندسی شیمی، علی پورجوادی