在调教 VOCALOID 声库时，如何正确地拆音？

Question

VOCALOID

在调教 VOCALOID 声库时，如何正确地拆音？

关注者

149

被浏览

31,543

5 个回答

其实没看懂啥叫“正确的”拆音……

短答案：前一个音元音结尾，后一个音（发音记号里）写-就可以延续上一个音了。类似 [- t] 这样的用法也是可以的。

辅音其实也可以后接一个[-]音符啦，但是有的不发声有的辅音拉长了会很奇怪（苦力怕：ssssssssssssss）。不过根据声库和歌曲的不同有时候用同一个发音记号（a a a这样）比用[-]的效果好（a - -这样）

好啦不想看我瞎逼逼的快去看楼上的好答案，人家有图哦乀(ˉεˉ乀)

一般拆音可以用来矫正发音和调整歌词以及代替PIT用……

把辅音+第一个元音单独拆一个很短的音符拉低一个（或几个）半音放在词的开头可以有效地代替从下往上钩的PIT，也就是这个词会有“有力”的感觉。具体效果嘛还是视情况而定(๑• . •๑)

对于Engloid来说将一些英语单词的结尾辅音放到下一个单词的开头会比较自然。可以单独把辅音拆出来然后往下一个音符那边拖或者直接修改下一个音符的发音记号……

总之就是以听着舒服为准啦（就不承认写不下去了）

发布于 2015-11-15 16:36

Accepted Answer

谢邀。下面将根据实际用途，从三个方面阐述拆音的用法。

一、为了咬字

例1、2：洛天依，x-ei的ei尾部拆出1/32的i（“1/32”这个长度取决于后面的音的辅音需要的长度，太短会强制缩短后面的辅音长。我们需要拆出i是为了让ei尾过渡至i嘴型，i音不占时长（即让其全部被后面音的辅音给吞掉））（尾拆），zh/ch-uan在1/64处之后拆出an（注意不是zh/ch-u+an）（前拆）；

例3.1、3.2：

乐正绫，为了发出日文e音，日文x-e=乐正绫x-ai/ei（长度<1/64，OPE<50）+a（剩余部分，OPE<50）；

中文声库，k-ei（长度→0）+i=日文ki；（造音）；

例4：中文声库，English=ing（ope<40，一半略短长度，这个“略短”是留给g的）+ge（长度<1/32，VEL=127）+li（VEL=0，一半长度）+xu（VEL=127，末尾用DYN衰减切掉）（拼词）。

二、为了指引音高曲线

不同音符间，音1的末尾会自动滑音至音2的音高：

1.“-”可把一个发音拆出多个音高，“-”拆出来的音VEL与OPE参数均无效，发音完全参照“-”前的音；但过渡点音量会受到音符表达属性里面的衰减和重音（也有版本译作“爆破音”）参数影响，大致当重音=50，衰减=0时，“-”只起到改变音高作用，而不会影响音量（前提是“-”前的音衰减也为0，不然拆音必将再影响到音量）；

2.音尾音头拆出Asp记号相当于拒绝自动滑音与此处留白的作用（如图）；

3.POR对于自动滑音位置的控制依然奏效，但是这个功能并没有什么用，因为完全可以通过改变“-”来控制自动滑音的开始位置（如图）。

三、为了控制辅音与元音的开始位置

1.我们知道，VEL可以控制辅音吞掉前一个音音尾的区域长度（这里只谈长度），对于每个辅音，每个VEL值（对于sh等清辅音，体现在sh将区域填满；对于d等浊辅音，该区域为空，d音体现在空区域到元音的瞬间过渡点）映射了一个区域长度，但是这样对于辅音长度的控制非常不方便——VEL值高低太抽象，对于使用不久的新声库调教师根本不知道VEL对应的辅音到底有多长。

这时，我们可以锁定发音符号，将元音和辅音强行拆至2个音（如图）；

对于辅音部分，V4自带音高识别功能可以体现出辅音区域的长度（其实红色曲线是模拟计算出的，不是识别出的）。显然，拆成2部分直接通过音长控制辅音长度要方便得多。

注：

（1）VEL有最低值0，而拆音可以控制清辅音无限长发音；

（2）对于辅音区域，重音、衰减与除了DYN外的所有参数（不考虑VEL）均无效，因此不需要考虑辅音区域的参数突变导致电音等；

（3）对于由VEL控制的无法感知的辅音区域，一个比较可怕的事实是，你辛辛苦苦在音尾做的PIT滑音或者自动滑音效果，由于辅音区域吞音长的不可控，音高曲线的实际形状是和你想象中的完全不同的，这是其一；其二是，其实某个音音尾自带了一个很可怕的滑音，但是被长辅音吞掉了，短辅音则无法吞掉，结果很多调教师开始抱怨：V的引擎是不是有Bug啊，怎么音尾总是有讨厌的滑音弄不掉，但是有的时候又没有。这时，通过拆音使辅音区域长度可控显得尤其重要了；

（4）控制辅音长度还有另外一个办法：在前一个音音尾拆一个-出来，把后一个音的VEL拉到0，那么这个-的头部能限制下一个音辅音的吞前一个音的最早的位置。

2.拆出Asp与Sil的意义

首先阐述一下自动滑音与自动连音的区别。如图，三组音，其中前2组音长皆相同，第三组音头位置相同，但是音1的音尾拉至两音间无空白。

可以得出的结论：

（1）由1-2-3-4音和5-6音之间平滑的音高曲线与4-5音间不平滑（音4尾部与音5音头是平的，稍有弯曲则是因为音是在一整句的音头和音尾，但可以断定的是它们不对称，因此没有自动滑音）的音高曲线可看出，2个音间隔小于t1（经过实验，这个t1是绝对时长，与BPM无关，下文t2同）时会产生自动滑音，大于t1时不会产生自动滑音；

（2）由1-2音与2-3音的音高曲线的是否连续可看出，2个音间隔小于t2（t2<t1）时，2个音会自动连音（即，你把2个音之间拉出了空白，但是间隔其实是假的，引擎渲染时会自动加特技，把音1尾自动拉长至音2头，就像5-6音那样），间隔大于t2时，2者发音将断开。从1-2音和5-6音的红色曲线的完全相同可看出，自动连音后二者等效。

那么问题就来了——我真的很想做出短促的音（但是并不想用DYN强行切除连音），间隔一段距离后再发第二个音的效果怎么办呢？这时就要用到Sil和Asp发音记号。

如图，前4个右上角带记号的音素是Asp（左右放大到最大依然是显示三个点所以就这样吧…），后2个是Sil。可以发现，即使t<t2<t1：

用了Asp和Sil发音记号拆开来后，Asp与Sil代表的区域全部强行空白；

用了Sil发音记号不影响自动滑音，用了Asp发音记号自动滑音取消。

这是在自动滑音方面的区别。在自动连音方面的区别如下图。

通过实验a Sil a音素和a Asp a音素的不同，从图中间部分可以看出：

在发音方面，用了Sil后，前一个音自然收尾；用了Asp后，近似于在Wav上强行切出空白区域。

综上，如果要制造短音效果，需要用到Sil与Asp符号拆音。其中，Sil相当于UTAU中的R，如果到了一句话句尾，也就是指句1尾和句2头间隔t>t2时，Vocaloid引擎会做出相当于在句尾自动加上一个Sil记号的效果，Sil自动连音到下一个音音头；Asp能起到消除自动滑音的效果，音收尾上比Sil效果更激进。

------------------------------------------------------------------End--------------------------------------------------------------------------

编辑于 2015-11-22 23:25