почитал разную хрень про обработку звука, в кратце, как я понял, такой эффект возникает при обработке звука в полудуплекс, смысл этого в следуещем сначала говорит один, слушают двое, потом второй, а нам надо заставить все это работать в фуллдуплекс и вот тут затык, наверное блюсолей этого не умеет
