GrO2Bl

جایی برای این که یاد بگیریم صدا و پردازشش چه طوری کار می‌کنه

همیشه یکی از دعواهای بین طرفداران خواننده‌های مختلف با هم سر اینه که کدوم خواننده می‌تونه نت‌های بالاتری رو اجرا کنه و حتی گاهی به این می‌نازن که کی بیشتر بلده داد بزنه. خب ما همه ممکنه عاشق موزیک‌هایی از شجریان، ابی، Mariah Carey، Freddie Mercury، George Michael و خیلیای دیگه از این دست باشیم. همه اینا خواننده‌هایی هستن که قابلیت اجرای نت‌های بسیار بالایی رو دارن. اما آیا واقعا چیزی که اینا رو خواننده بزرگی می‌کنه فقط خوندن (یا به اصطلاح هیت – hit کردن) اون نت‌های بالاس؟ تو این نوشته فرض رو بر این گذاشتم که با مفاهیم ابتدایی نت مثل اسامیشون و جایگاهشون آشنایید، چون توضیح اونا خودش یه پست جداگونه می‌طلبه.

حنجره انسان یه جور سازه، با تمام قابلیت‌ها و محدودیت‌های یه ساز. اگه از ساز‌های الکترونیک صرف نظر کنیم، همه ساز‌ها یه محدوده خاصی از فرکانس‌های صدا رو تولید می‌کنن. به عبارت دیگه نت‌های هر ساز یه محدوده مشخصی داره. مثلا یه پیانوی استاندارد از نت A0 تا C8 (لای اکتاو صفر تا دوی اکتاو ۸) رو تولید می‌کنه. یه فلوت آلتو از C4 تا C7 رو تولید می‌کنه. یه گیتار E3 تا E6 (می اکتاو ۳ تا می اکتاو ۶) و به همین ترتیب همه ساز‌ها محدودیت تولید فرکانس دارن که می‌تونید اینجا این موضوع رو برای ساز‌های ارکسترال چک کنید. در ارتباط با بازه یا گستره (Range) صدا، استفاده از مقیاس فرکانس بسیار دقیق‌تر از نته، اما به دلیل این که تمام منابع تئوری موسیقی معیار رو نت‌های استاندارد (دو/C – ر/D – می/E – فا/F – سل/G – لا/A – سی/B) قرار میدن ما هم همین روش رو پیش می‌گیریم. با در نظر گرفتن این موضوع و محدودیت‌های فیزیکی و آناتومی هر حنجره، بازه صدای انسان (Vocal) به شش دسته کلی تقسیم میشه.

۱. بیس (Bass)

این نوع صدا بم‌ترین نوع صدای حنجره است که از نت E2 تا E4 گسترده میشه با این حال بعضی از خواننده‌های bass می‌تونن از بالا تا F4 یا G4 و از پایین تا C2 هم بازه صداشونو با تمرین گسترش بدن. از خواننده‌های معروف این دسته Leonard Cohen و Sting رو میشه نام برد. ویژگی اصلی این دسته صدا، اجرای نت‌های بم قوی و اجرای نرم‌تر نت‌های میانیه.

۲. باریتون (Baritone)

این نوع صدا رایج‌ترین نوع صدا بین آقایونه که بازه اون از A2 تا A4 گسترده میشه که بعضی از خواننده‌های باریتون می‌تونن از بالا تا C5 و از پایین تا F2 رو با تمرین گسترشش بدن. از خواننده‌های معروف این دسته Elvis Presley و Frank Sinatra رو میشه نام برد. ویژگی اصلی این دسته صدا اجرای نت‌های میانی قوی برای صدای آقایونه و نت‌های بم رو نرم‌تر از بیس اجرا می‌کنن.

۳. تنور (Tenor)

این نوع صدا بالاترین نوع صدای آقایونه که بازه راحتش بین C3 تا C5 گسترده میشه که بعضی از خواننده‌های این دسته می‌تونن از بالا تا E5 و از پایین تا A2 رو با تمرین گسترشش بدن. به خواننده‌هایی که تا E5 رو می‌خونن اصطلاحا CounterTenor یا Contra Tenor هم گفته میشه. از خواننده‌های معروف این دسته Andrea Bocelli و Freddie Mercury رو میشه نام برد. ویژگی اصلی این دسته اجرای نت‌های بالای قوی و توانایی ورود به بازه صدایی خانم‌ها به صورت نرم‌تر با استفاده از تکنیک فالستوئه.

۴. آلتو (Alto)

این نوع صدا بم‌ترین نوع صدای خانم‌هاست که بازه معمولش بین F3 تا F5 گسترده میشه که بعضی از خواننده‌های این دسته از بالا تا A5 و از پایین تا C3 رو با تمرین گسترشش میدن. کسانی که از پایین می‌تونن تا C3 بخونن بهشون Contralto هم گفته میشه که در واقع تو دسته صدای تنور آقایون قرار می‌گیرن. از خواننده‌های معروف این دسته Adele و Norah Jones رو میشه نام برد.

۵. متزو سوپرانو (Mezzo Soprano)

این نوع صدا بازه میانی خانم‌هاست که بین آلتو و سوپرانو قرار می‌گیره و از A3 تا A5 مشخص میشه که بعضی از خواننده‌های این دسته از بالا تا C6 و از پایین تا F3 هم می‌خونن. اما تو اجرای نت‌های پایین نمی‌تونن قدرت صدای آلتو رو داشته باشن و همین‌طور اجرای نت‌های بالاشون به قدرت سوپرانو نیست با این حال نت‌های میانی رو پر قدرت اجرا می‌کنن. از خواننده‌های معروف این دسته Dua Lipa و Sara Bareilles رو میشه نام برد.

۶. سوپرانو (Soprano)

این نوع صدا بالاترین نت‌های خانم‌ها رو اجرا می کنه و بازش از C4 تا C6 گسترده میشه که با تمرین بسیار می‌تونن حتی نت‌های آلتو رو هم در بر بگیرن، یعنی از پایین تا F3 و از بالا هم تا F6 گسترده میشن. از خواننده‌های معروف این دسته Kelly Clarkson و Maria Callas رو میشه نام برد.

این شکل از وبسایت musicnotes.com به طور خلاصه کل این حرفا رو نشون میده.

نمودار بازه صدای انسان روی پیانو

همون‌طور که متوجه شدید برای هر شش دسته، دو اکتاو (شامل ۱۴ نت اصلی) مشخص شده که اون بازه، بازه اجرای راحت و بدون فشار نت‌ها برای اون دسته‌اس و خواننده‌های هر دسته تو همون بازه بیشترین کنترل و قدرت رو دارن و هم‌پوشانی نت‌های بین دسته‌ها، رو نقاط مرزی اتفاق میافته که برای یه دسته زیادی بالا و برای یه دسته دیگه زیادی پایین به حساب میاد و خوندن اون نت‌های مرزی برای هر دسته به شدت مشکل میشه.

حرف آخر

آیا می‌تونیم بگیم که صدای فلوت از گیتاربیس بهتره؟ آیا می‌تونیم فقط به دلیل این که یه خواننده نت‌های بالاتری رو می‌خونه بگیم، خواننده بهتری از دیگریه؟ با مقایسه خواننده‌های هر دسته می‌فهمیم که به هیچ عنوان نمیشه گفت کدوم بهترن. در نتیجه چیزی که یه خواننده رو خواننده بهتری می‌کنه بازه صداش نیست. کنترل، تکنیک، توانایی انتقال احساس، انتخاب ترانه و موسیقی، مخرج حروف و اصوات و خیلی فاکتور‌های دیگه هستن که تو مقایسه خواننده‌ها از لحاظ کیفی تعیین کننده‌ میشن.

همه ما دور و برمون وسایل و اپ‌هایی داریم که باهاشون موزیک گوش می‌دیم یا فیلم می‌بینیم. از تلویزیون گرفته تا دستگاه پخش‌کننده خودرو، از VLC تا اپای تو گوشیامون. بسیاری از این‌ها تو تنظیماتشون گزینه‌ای دارن که میشه باهاش کاری کرد که یه اسپیکر یا هدفون ارزون قیمت، صدایی به دقت یه اسپیکر دو برابر قیمتش رو تولید کنه و یا صدایی که مطلوب سلیقه ما باشه. همین‌طور میشه باهاش کاری کرد که فاجعه به بار بیاد و به مرور باعث آسیب به شنوایی ما، نابود کردن هنر مهندسان میکس و صدا و آسیب به اسپیکر بشه. این گزینه Equalizer، به اختصار EQ، در نگارش فارسی ایکوالایزر، نگارش عامیانه‌تر اکوالایزر یا اکولایزر و معنای فارسیش برابرسازه.

این ابزار یکی از پرکاربردترین ابزارها تو استودیوهای ضبط و میکس صدا و موسیقیه. وظیفه این ابزار خیلی ساده‌اس، با این ابزار میشه یک بازه مشخص فرکانسی رو تقویت یا تضعیف کرد، ساده‌تر بگم، صدای اون فرکانس (یا بازه فرکانسی) رو کم و زیاد کرد.

برای این که بدونیم EQ چه طوری می‌تونه تجربه شنیداری ما رو بهبود بده، اول باید بدونیم یه موسیقی یا صدا تو چه شرایطی میکس و مراحل پساتولیدش (post production) طی میشه. تو استودیو‌ها یه عالمه پول خرج می‌کنن تا اسپیکری بخرن که تا جای ممکن تمام فرکانس‌های قابل شنیدن توسط انسان رو به صورت مسطح (flat) پخش کنه، که بهش اسپیکر مانیتورینگ میگن. این اسپیکرها از دقت بسیار بالاتری نسبت به بقیه اسپیکرها برخوردارن و به همین دلیل هم خیلی گرون قیمتن. انسان به طور معمول صداهای با فرکانس ۲۰ هرتز تا ۲۰ کیلوهرتز رو می‌شنوه که همون هم از فردی به فرد دیگه بر اساس سن و یه سری فاکتور دیگه متفاوت میشه. علاوه بر اون ما این فرکانس‌ها رو حتی اگه با بلندی یکسان پخش بشن، هم‌دامنه نمی‌شنویم. مثلا اگه صداهایی با فرکانس‌های ۴ کیلوهرتز و ۲۰۰ هرتز با بلندی یکسان ۴۰ دسیبل پخش بشن ما حس می‌کنیم فرکانس ۴ کیلوهرتز حدود ۱۰ دسیبل بلند‌تر پخش شده و این خطا (یا شاید در طبیعت مزیت) شنیداری انسانه. اما وقتی می‌گیم اسپیکر داخل استودیو باید تا حد امکان فلت باشه منظور چیه؟ منظورمون این نیست که به گوش ما فلت بیاد، بلکه منظورمون اینه که باید بتونه تمام فرکانس‌ها رو با بلندی یکسان پخش کنه که این رو میشه با بررسی پاسخ فرکانسی هر دستگاه آزمایش کرد و باید بگم که در عمل هیچ اسپیکری صد در صد فلت نیست. خلاصه مهندس میکس جلوی یه اسپیکر خیلی دقیق و فلت میشینه و بر اون اساس که یه معیار مرجع و کالیبره حساب میشه کار میکس رو انجام میده و بعد موسیقی یا صدای ضبط شده به دست ما میرسه که می‌خوایم اونو با اسپیکر یا هدفون ۱۰ دلاریمون بشنویم. حالا بریم ببینیم اگه از صدایی که می‌شنویم چندان راضی نیستیم، چه طوری می‌تونیم تجربه شنیداری بهتری رو با کمک EQ داشته باشیم. این یه دستورالعمل جامع نیست ولی سعی کردم تا حد امکان دقیق و آسون باشه. اولین کاری که باید بکنیم انتخاب یه آهنگ مرجعه که به سلیقه ما نزدیک‌تره، یه کسی که کارشو بلده اونو میکس و مسترینگ کرده و همه جور صدای زیر و بمی در طول کار پخش میشه. معمولا گزینه خوب با جستجوی همچین چیزایی به دست میاد: Trance Music Reference Track Rock Music Reference Track

مرحله دوم پیدا کردن یه نرم‌افزاره که بهمون Spectrum Analyzer یا چیزی شبیه به این رو بده. تمام نرم‌افزارهای DAW اینو دارن، Audacity هم اینو داره، سرچ کنید حتی برای گوشی هم با اسامی متفاوتی پیدا میشه. حتی بسیاری از EQها تو پس‌زمینشون این نمودار رو نشون میدن که در این صورت همین کافیه. کار این ابزار نمایش دیداری فرکانس‌هاییه که در حال پخش از سیستم شماست و نه اسپیکرتون. فقط مهمه که ما از این ابزار روی همون دستگاهی که می‌خوایم ازش موزیک رو پخش کنیم استفاده کنیم.

مرحله سوم تطابق و مقایسه صدای پخش شده از اسپیکر با چیزیه که تو Spectrum Analyzer می‌بینیم. برای این کار ۲ راه کلی وجود داره: ۱. استفاده از یک میکروفن دقیق و فلت برای ضبط صدای خروجی از اسپیکر تو یه محیط با آکوستیک طبیعی و تطابق فرکانسا با فرکانس‌های آهنگ اصلی. که انجام درست این کار نیاز به یه میکروفن حداقل ۷۰۰-۸۰۰ دلاری و یه اتاق با آکوستیک مناسب داره. اینجا دوباره بحث فلت بودن میکروفن میاد وسط و نمیشه از هر میکروفنی استفاده کرد. ضمن این که این کار برای تنظیم هدفون جواب نمیده. ۲. استفاده از گوش و چشم همزمان. با نگاه کردن به Spectrum Analyzer می‌تونیم چیزای زیادی رو بفهمیم. مثلا این که صدای فرکانس‌های بم نسبت به سایر فرکانس‌ها چه وضعیتی دارن؟ آیا بلند‌ترن؟ اگه آره، آیا ما داریم اونا رو به اندازه کافی بلند‌تر می‌شنویم؟

حالا می‌تونیم ذره ذره با تنظیم پارامترای EQ فرکانس‌ها رو کم و زیاد کنیم تا اسپیکر به صدای مرجع نزدیک بشه. این تنظیمات برای نزدیک کردن اسپیکر به صدای یه اسپیکر فلت انجام شده اما لزوما با تفاوت‌های شنیداری ما و محدودیت‌های اسپیکر سازگار نیست. پس اگه لازم بود می‌تونیم همین مرحله آخر رو این بار با یه تکنیک دیگه انجام بدیم. تو این تکنیک ما با بستن چشممون تمرکز ذهن رو به طور کامل به سمت چیزی که می‌شنویم می‌بریم. وقتی چشممون بسته‌اس و هوشیار هستیم مغز تجزیه و تحلیل دقیق‌تری روی صدایی که می‌شنویم انجام میده. حالا باید از خودمون بپرسیم این صدایی که می‌شنویم چی کم یا زیاد داره؟ حالا فرکانس مربوط به اون رو پیدا می‌کنیم و تغییرش میدیم. آشنایی با فرکانس‌ها و EQ زمان می‌بره باید تمرین کنید و باهاش بازی کنید. جایی که حس کردید دارید صدای بهتری می‌گیرید یعنی دارید یاد می‌گیرید.

شما نمی‌تونید با EQ به تنهایی معجزه کنید ولی تو موارد بسیاری می‌تونه به بهبود صدایی که می‌شنویم کمک کنه. اما در عین حال اگه ندونید که چه کار می‌کنید (مثل اکثر کسانی که EQ ماشین شما رو دستکاری می‌کنن) می‌تونه به مرور به شنواییتون و همین‌طور با فشار آوردن به محدودیت‌های اسپیکرتون باعث آسیب بشه. همیشه باید تغییرات حجم صدای یه فرکانس آهسته انجام بشه و جایی که حس می‌کنید داره به اسپیکر فشار میاد، دارید محدودیت‌های فرکانسی اسپیکر رو رد می‌کنید. افزایش حجم صدا به معنای افزایش ولتاژ برای اسپیکره، نباید ازش ترسید ولی باید حواسمون بهش باشه. اکثر مواقع میشه با کم کردن صدای یه سری فرکانس‌ها به جای زیاد کردن بقیه فرکانس‌ها به صدای مطلوب رسید. این روش کمک می‌کنه به اسپیکر فشار نیاد.

مدت‌هاست که ذهنم درگیر تفکرات و توضیحات متناقضی در مورد DRM و کپی‌رایت شده. من خودم بین این دو دنیا گیر کردم. پس امیدوارم با خوندن این پست، این حس براتون به وجود نیاد که دارم از زاویه دید یه کارشناس مسائل و مصائب اجتماعی و حقوقی نظر میدم. گفتم بین این دو دنیام چون از طرفی برنامه‌نویس (توسعه دهنده یا هر چی که دوست دارید) و طرفدار نرم‌افزار آزاد و متن‌باز (open source) هستم و از طرفی یه آهنگساز.

بیایم اول مسئله رو یه کم از دیدگاه تولید کننده یه محصول دیجیتال، موسیقی، فیلم، بازی یا نرم‌افزار نگاه کنیم. گاهی یه محصول فقط برای یادگیری، تمرین یا fun (واقعا تفریح واژه جالبی برای اینجا نبود) تولید میشه. در واقع منی که اون رو ساختم نمی‌خوام ازش کسب درآمد کنم و به اختیار خودم اون رو آزادانه و رایگان در اختیار دیگران میذارم. اما این موضوع همیشه پیش نمیاد. در بسیاری از موارد من از این راه برای گذران زندگی یا پرداخت هزینه‌های تولید و نگهداری، کسب درآمد می‌کنم و این کاملا منطقی به نظر می‌رسه. من دارم محصولی رو تولید می‌کنم که فیزیکی نیست ولی براش وقت و هزینه و خیلی چیزای دیگه رفته تا دیگران ازش استفاده کنن یا لحظه‌های خوبی رو باهاش بسازن. ولی نه به صورت رایگان، من اگه نتونم این درآمد رو داشته باشم، طبیعتا دیگه نمی‌تونم این محصول رو تولید کنم. این که من بخوام از این محصول یا سرویس درآمد داشته باشم منطقی به نظر میاد نه؟ همون طور که توقع نداریم کسی یه کیف رو به ما رایگان بده و ما بابت خریدش پول میدیم. یا مثال نزدیک‌تر، ما توقع نداریم که به ما رایگان غذا بدن. غذا هم نیاز گرسنگی ما رو برطرف می‌کنه استفاده میشه و تموم میشه و دیگه وجود فیزیکی نخواهد داشت.

حالا از دید مصرف‌کنندگانی که مخالف DRM و کپی‌رایت هستن. من با خیلی از کسانی که این مدل نگرش رو نسبت به این موضوع دارن صحبت کردم و کمی هم تحقیق کردم. به طور کلی دلایل مختلفی برای این مخالفت‌ها هست. وقتی من یه محصول فیزیکی رو می‌خرم، مالکیتش به من منتقل میشه و من هر کاری بخوام می‌تونم باهاش بکنم. در بسیاری از موارد حتی می‌تونم دوباره بفروشمش. اما در مورد محصول دیجیتالی و نرم‌افزاری این امکان وجود نداره و در بسیاری از موارد من با محدودیت‌های زیادی مواجه میشم که گاهی غیر منطقی به نظر می‌رسه. مثلا من نمی‌تونم یه کتابو از آمازون بخرم، اونو دانلود کنم و با هر دستگاه و نرم‌افزاری که می‌خوام بخونمش. من باید حتما با خود نرم‌افزار کیندل اون کتابو بخونم یا این که DRM رو بشکونم و ادامه ماجرا که غیر قانونیه. حالا قضیه جدی‌ترم میشه اگه تصور کنیم که مثلا من ۱۰۰ تا فیلم و کتاب از گوگل خریدم و حالا به هر دلیلی گوگل تصمیم می‌گیره که دیگه به من سرویس نده یا مثلا فرض کنید تصمیم بگیره اپ‌های تماشای فیلم و خوندن کتابش رو از رده خارج کنه و دیگه چنین سرویسی وجود نداشته باشه. خب می‌بینیم که من همه اونا رو از دست میدم چون مطمئنا اونجا بهم نمی‌گن که خب حالا بیا فایلاشو دانلود کن واسه خودت. پس اینجا منی که مصرف‌کننده و کاربر هستم ضرر می‌کنم. در واقع اینجا قوانین حمایت از مصرف کننده با قوانین مربوط به Copyright و DRM به تضاد می‌خورن. من وارد تمام دلایل و نقطه نظرهای دو طرف این داستان دیگه نمیشم که حرف زیاده! فقط خواستم موضوع از هر دو زاویه دیده بشه.

حالا راه حل چیه؟ آیا اگه DRM و Copyright حذف بشه مشکل حل میشه؟ نه این کاملا به ضرر تولید کننده، هنرمند، فیلم‌ساز، گرافیست، نقاش وغیره‌اس، و دیگه سنگ روی سنگ بند نمیشه و عادلانه نیست. وضعیت موجود با تمام بدی‌هاش خیلی عادلانه‌تر به نظر میاد. موضوع چالش برانگیز بعدی اینه که آیا اگه محصول دیجیتال به صورت غیرقانونی لو رفت یا کرک شد دیگه نباید حقی برای شکایت تولید‌کننده درنظر گرفت؟ به نظر منصفانه نمیاد ولی باید شکایت به شکل و مقصد درستی انجام بشه. بیایم یه نگاه به اتفاق اخیر در مورد Nintendo بندازیم. چند روز پیش حکم پرونده شکایت Nintendo از Yuzu صادر میشه و در اون Yuzu محکوم شناخته شده و باید علاوه بر توقف انتشار Emulator نینتندو بیش از ۲ میلیون دلار هم به نینتندو خسارت پرداخت کنه. Yuzu یه Emulator متن‌باز برای کنسول نینتندو سوییچه که میشه باهاش بازی‌های سوییچ رو روی کامپیوتر و گوشی اجرا کرد. تا اینجاش موضوع چندان برای نینتندو مهم نیست با وجود این که این کار هم برای یه محصول در حال تولید و فروش غیرقانونیه. چیزی که خرابش می‌کنه و به بحث ما مربوط میشه اینه که با این Emulator میشه بازی‌های کرک شده سوییچ رو هم بازی کرد که در حالت عادی رو خود کنسول امکانش نیست و نیازه یه دستکاری‌هایی روی کنسول اتفاق بیافته. نینتندو از جایی شروع می‌کنه به فشار آوردن که یکی از پرفروش‌ترین و همین‌طور پرهزینه‌ترین بازی‌هاش (The Legend of Zelda: Tears of the Kingdom) قبل از انتشار رسمی کرک شده و یک میلیون نفر اون رو با این Emulator بازی کردن و این یه خسارت خیلی بزرگ برای نینتندو به حساب میاد. در نظر بگیرید قیمت این بازی ۷۰ دلاره. موضوع شکایت یه کم عجیبه چون سازنده یه Emulator متن‌باز نمی‌تونه مسئولیت این که چه چیزی با محصولش بازی میشه رو به عهده بگیره! همین‌طور خیلی از مردم هم به نینتندو حمله می‌کنن که اصا چرا شکایت کرده. در واقع انگار توقع اینه که نینتندو اگه ضرر کنه و حق سازندگان بازی خورده بشه اوکیه چون یه کمپانی بزرگه و کلی پول داره. این نقطه، نقطه خطرناکیه. برخی هم یه نظر فلسفی دارن که کرک کردن یا انتشار غیرقانونی محصول دیجیتال دزدی حساب نمیشه چون دزدی به چیزی میگن که اگه کسی ازت چیزی رو بدزده تو دیگه نباید اونو داشته باشیش ولی داریش! پس این دزدی نیست! اووووکی! شما واژه بهتری سراغ داری که مفهوم ناشایست بودن این موضوع رو برسونه خوشحال میشم بدونم. چون مطمئنا اگه خودت تولید‌کننده اون محصول بودی دیگه این حس و نظر رو نمی‌تونستی داشته باشی.

متاسفانه خیلی از مردم سرتاسر دنیا هم که کلا مخالف پول دادن به یه محصول دیجیتالی هستن. یعنی شما اگه یه کوسن بری برای خونت بخری ۱۰ دلار اوکیی باهاش ولی حاضر نیستی همون پول رو به یه محصول دیجیتالی که می‌خوای مدت‌ها باهاش سرگرم باشی بپردازی و ترجیح میدی بدون پرداخت حق تولیدکنندش از اون استفاده کنی. خب مسئله اینجاس که اگه فکر می‌کنی محصول ارزش اون پول رو نداره به راحتی می‌تونی ازش استفاده نکنی نه این که چون من نمی‌خوام پولشو بدم پس برم بدزدمش! همین‌طور چرا وقتی یه کمپانی یا فرد دیگه که ما فکر می‌کنیم پولداره خسارت می‌بینه ما اونا رو محق نمی‌دونیم تا قانونی ازشون حمایت کنه ولی اگه یه نفر که ضعیف‌تره یه خسارت و ضرری به یه کمپانی بزنه از نظر ما اوکیه؟ به نظر من اینا دیگه خیلی ریشه اجتماعی، روانشناسی و فرهنگی داره که از سواد من خارجه.

در آخر بگم شاید نرم‌افزار آزاد و متن‌باز تونسته کمی اوضاع رو تو این زمینه با فراهم کردن گزینه‌های جایگزین مناسب عادلانه کنه. به این صورت که اگه من نیاز به یه نرم‌افزاری دارم اول به گزینه‌های متن‌باز و رایگان نگاه می‌کنم و اگه چیز مناسبی پیدا نکردم بعدش میرم یه نرم‌افزار تجاری رو می‌خرم. ولی دزدیدن تو گزینه‌هام نباید باشه، مگر این که تو کشوری مثل ایران باشم که حتی با فرض داشتن توان خرید، باز هم اون کمپانی مثل نتفلیکس و آمازون و غیره به شکل ناعادلانه‌ای به من سرویس نده. در این صورت موضوع برای من یه کم شخصی و اعتراضی میشه. ولی متاسفانه این رویکرد در مورد سایر محصولات دیجیتال که خاصیت ابزاری ندارند مثل محصولات هنری امکان‌پذیر نیست. شما می‌خوای یه فیلم خاص رو ببینی نه جایگزینشو. شاید نیاز داریم تا ترکیب بهتری از قوانین حمایت از مصرف‌کننده و تولیدکننده تدوین بشه، تکنولوژی‌ها و فرمت‌ها و راهکارهای متفاوتی ایجاد بشن تا بتونن از حقوق هر دو سو محافظت کنن و نهایتا فرهنگ‌سازی که پررنگ‌ترین نقش رو تو تمام مسائل ایفا می‌کنه.

خیلی وقتا شده که وقتی تو یه جمع نشستیم و یه موزیک پخش میشه یکی اعتراض می‌کنه و میگه “صدای این یارو که کلا کامپیوتریه” یا “با دستگاه درست شده”. می‌خوام یه کم از زاویه مهندسی صدا و موسیقی این موضوعو دقیقش کنم. با بررسی یه سری چیزا می‌تونیم توضیح بدیم که این ذهنیت عمومی از کجا میاد و همین‌طور منظور اصلیشون چی بوده از این حرف. فقط همین اول نوشته بگم که من وارد مباحث مربوط به AI که این چند وقت داغه نمیشم، موضوع این تصورات قدیمی‌تر از این حرفاس. این تصورات به این دلیل شکل گرفتن که از زمان خیلی دور تا الان، تصاویری که از استودیوها بیرون میاد شامل یه عالمه دم و دستگاه و داستان میشه. و عموم مردم فکر می‌کنن که الان این همه دستگاه و غیره یه عالمه تغییرات روی صداهای ورودی ایجاد می‌کنن تا به خروجی برسن. غافل از این که هر کدوم از اون دستگاه‌های بزرگ نهایتا می‌تونستن یکی دو تا پردازش خیلی ساده انجام بدن. مثلا یکیشون فقط می‌تونست یه ذره reverb (فکر کنم فارسیش بازآوا باشه) ایجاد کنه، این همون چیزیه که وقتی تو اتاق خالی یا حموم می‌خونید می‌شنوید. خیلی ساده به نظر میاد نه؟ ولی سال ۱۹۵۷ یه دستگاه بزرگ ۲۷۰ کیلویی برای انجام این‌کار تو استودیو نیاز بود!

حالا الان به جایی رسیدیم که این افکت می‌تونه از طریق یه لپتاپ و یه نرم‌افزار روی هر صدایی اعمال بشه. پس این ذهنیت از گذشته از اینجا میاد. اما تا چه حد این پردازش‌ها و افکت‌ها می‌تونن صدای ورودی رو تغییر بدن؟ آیا می‌تونم صدای گیتار ۱۰۰ دلاریمو شبیه صدای ۱۰۰۰۰۰ دلاری کنم؟ خیر نهایتا می‌تونی سوتی‌های نوازندگیتو تا یه حدی بپوشونی و نهایتا صداشو شبیه یه گیتار ۲۰۰ دلاری کنی. همینو ببریم تو صدای خواننده: می‌تونم صدامو شبیه ابی کنم؟ خیر ما فقط می‌تونیم بعضی از ایرادات صدا و اجرای شما رو بگیریم. اینا مکالمات واقعی بودن که من بارها تو استودیوهای مختلف می‌شنیدم. صدا یه موجه که از طریق هوا منتقل میشه (دیگه تو فیزیکش نریم). مثل خیلی از امواج دیگه ما می‌تونیم این امواج صوتی رو با استفاده از تجهیزات الکترونیکی مختلفی تبدیل به چیزی کنیم که بتونیم ذخیرش کنیم، نمایش بدیم و بازپخش کنیم. اما تغییر کیفیت و ساختار اون موج قبل از بازپخش چیزیه که ما امشب در موردش صحبت می‌کنیم که با استفاده از “نرم‌افزارها” و “دستگاه‌های” پردازش صدا در استودیوها انجام میشه. بله من گفتم تغییر و بعد هم گفتم نرم‌افزار و دستگاه، اما اینا چوب جادو نیستن و فقط ابزارن. شناخت توانایی‌ها و محدودیت‌هاشون کمک می‌کنه به این که بدونیم چه تغییراتی شدنی و چه تغییراتی نشدنی بوده (حداقل تا قبل از این همه‌گیری AI). در واقع کاری که ما انجام میدیم چیزی مثل روتوش کردن یه تصویره و نه نقاشی اون از اول. ما می‌تونیم فرکانس‌های مختلف صدا رو تقویت یا تضعیف کنیم، حجم صدا رو کنترل کنیم، یه سری افکت محیطی بهش اضافه کنیم و از این دست کارا که هیچ کدوم اینا ماهیت و کیفیت صدای خواننده رو تغییر بنیادی نمیده.

اما یه کار دیگه هست که از حدود ۳۰ سال پیش اختراع و به کار گرفته شد. که اون همون تغییر شیطنت‌آمیز و بحث برانگیزیه که بهش عموم مردم کامپیوتری شدن صدا میگن. وقتی یه ساز می‌خواد نواخته بشه قبلش نیازه که کوک بشه. کوک شدن یه ساز یعنی نت‌های مختلفی که از ساز خارج میشن باید دقیقا فرکانس‌های مرجع اون نت رو تولید کنن. یه جورایی مثل کالیبره کردن. مثلا نت لا (A) تو اکتاو ۴ باید فرکانس ۴۴۰ هرتز رو تولید کنه. سازها معمولا برای کوک کردنشون پیچی چیزی دارن که بشه تنظیمش کرد. حالا چی کار با صدای انسان کنیم که کوک بشه؟؟ تا ۳۰ سال پیش هیچی جز تمرین و ممارست فراوان! اما ۳۰ سال پیش یه دستگاه و بعدا نرم‌افزاری تولید میشه که کمک می‌کنه بتونیم صدای انسان رو حین اجرا و بعد از ضبط کوک کنیم تا نت‌ها رو نزدیک به فرکانسی که باید اجرا بشن ببره. به این افکت یا دستگاه فیزیکیش اصطلاحا tune – auto tune – vocal tuner و از این مدل اسما میگن که قسمت مهمش همون tune که یعنی کوکه مشکلش کجاست؟ مشکل اینجاس که هر چه قدر نت اجرا شده از اون چیزی که باید، فاصله بیشتری داشته باشه، برگردوندنش به نت اصلی، بیشتر باعث تغییر تو لحن و حالت صدا میشه که به شدت غیر طبیعی و گاهی زننده‌اس. علاوه بر این وقتی شدت این افکت در بالاترین حدش تنظیم میشه، تمام تلاشش رو می‌کنه که نت لا دقیقا با فرکانس 440 هرتز اجرا بشه حتی 440.5HZ هم قابل قبول نیست. اینجا اونجاییه که شنونده یه احساس غیر طبیعی به صدا پیدا می‌کنه. حسی مثل صدای یه ربات. این یعنی تغییر یه نت به یه نت دیگه از حالت طبیعی، که طیفیه، خارج میشه و به نوعی شبیه توابع پله‌ای تو ریاضی عمل می‌کنه. به زبان ساده اگه از نت لا بخوایم بریم به سی یعنی از فرکانس 440HZ به 493.88HZ میریم. یه عالمه عدد اون وسطه نه؟ این تغییر در حالت عادی مثلا تو ۲۰ میلی ثانیه اتفاق میافته ولی اگه شدت اعمال این افکت زیاد باشه این تغییر مثلا تو ۱ میلی‌ثانیه اتفاق میافته و این غیر طبیعیه! هنجره انسان چون یه ابزار ساخت دستمون نیست قابلیت‌های بسیار زیادی داره و به خاطر همین قابلیت‌ها، توانایی ایجاد صداهایی رو داره که هیچ سازی نمی‌تونه تولید کنه. اما به خاطر همین انعطاف‌پذیری، حتی بهترین خواننده‌های تاریخ هم تو اجراهای ضبط شدشون میشه گاهی خارج شدن از کوک رو شنید که البته تشخیصش نیاز به گوش تخصصی و تمرین داره. پس اگر این طوره چرا موزیکی که ۵۰ سال پیش خونده شده با این که tune نبوده انقدر کوک به نظر میاد؟ چون اولا مجبور بودن ۱۰۰ برابر الان یه کارو قبل از اجرا تمرین کنن و این مهارتشونو بالا می‌برد. دوم (که خیلی مهمه) اینه که اکثر موزیک‌های قدیمی با سازهای آکوستیک و به صورت زنده اجرا و ضبط می‌شدن. خود اون ساز‌ها ممکن بود جای 440HZ روی چند دهم هرتز کم و زیاد کوک شده باشن و وقتی خواننده هم روش اجرا می‌کرد، یه کوچولو خارج شدنش به چشم نمیومد چون با یه ساز دیگه تو همون قسمت ممکن بود هم‌کوک بشه. اما با اومدن موسیقی الکترونیک دیگه کوچیک‌ترین فالشی خواننده کاملا خودشو نشون میداد چون بقیه صداها کاملا کوک اجرا میشن. مثل این که وسط یه مهمونی که همه کت شلوار پوشیدن شما با شورت بری خب خیلی تابلوئه! این شد که به این نتیجه رسیدن صدای انسان هم دیگه از اینجا به بعد tune می‌خواد. همین قدر بهتون بگم که تقریبا “تمام” کارهایی که از استودیو بیرون میاد و نیمی از کنسرت‌هایی که میرید صدای خواننده tune داره. گاهی شدتش زیاده و گاهی کم که شما متوجه نمیشید و گاهی با وجود زیاد بودنش هنرمندانه و ظریف اعمال شده و شاید سبک موسیقی ایجاب می‌کرده. صدای همایون شجریان، صدای Adele صدای هر کسی که قبولش دارید هم tune داره. پس حالا با این ذهنیت نگاه کنید. Tune عضو جدا نشدنی موسیقی امروز شده اما نهایتا نمی‌تونه از شما ابی و مایکل جکسون بسازه. جمله آخر. خواننده خودش می‌تونه صداسازی کنه مثل آقای چاوشی و این هیچ ایرادی هم نداره، تو همه جای دنیا رایجه. ولی این که فکر کنیم یکی میره دکلمه می‌کنه و بعد از توش یه آهنگ خوشگل میاد بیرون، این کاملا غلطه. حالا این که چه خواننده‌ای مهارت بیشتری داره و کدوم کم‌تر، این جا جاییه که اجرای لایو بدون هیچ افکتی می‌تونه مورد مقایسه قرار بگیره یعنی وقتی طرف جلوتون می‌خونه، بدون میکروفون. این روزا حتی تو لایو اینستا هم کم‌یابه ;) البته اگه موزیسین باشید و گوش قوی کمک می‌کنه به مرور تشخیصش بدید.