125 lines
3.7 KiB
Markdown
125 lines
3.7 KiB
Markdown
![]() |
---
|
|||
|
id: 594faaab4e2a8626833e9c3d
|
|||
|
title: Розбиття рядка на лексеми методом екранування
|
|||
|
challengeType: 5
|
|||
|
forumTopicId: 302338
|
|||
|
dashedName: tokenize-a-string-with-escaping
|
|||
|
---
|
|||
|
|
|||
|
# --description--
|
|||
|
|
|||
|
Напишіть функцію або програму, що може поділити рядок кожного разу коли зустрічається не ізольований розділювач.
|
|||
|
|
|||
|
Вона має містити три вхідні параметри:
|
|||
|
|
|||
|
<ul>
|
|||
|
<li><strong>рядок</strong></li>
|
|||
|
<li><strong>розділювач</strong></li>
|
|||
|
<li><strong>escape-символ</strong></li>
|
|||
|
</ul>
|
|||
|
|
|||
|
Вона має вивести список рядків.
|
|||
|
|
|||
|
Правила для розділення:
|
|||
|
|
|||
|
<ul>
|
|||
|
<li>Поля, розділені розділювачами, стають елементами вихідного списку.</li>
|
|||
|
<li>Пусті поля потрібно зберегти, навіть на початку та вкінці.</li>
|
|||
|
</ul>
|
|||
|
|
|||
|
Правила для екранування:
|
|||
|
|
|||
|
<ul>
|
|||
|
<li>"Екранований" означає той, якому передує escape-символ, який ще не є екранованим.</li>
|
|||
|
<li>Якщо escape-символ передує символу, що немає спеціального значення, то він все ще вважається екранованим (але не робить нічого особливого).</li>
|
|||
|
<li>Кожна поява escape-символу, який використовувався для екранування чогось, не повинна стати частиною виводу.</li>
|
|||
|
</ul>
|
|||
|
|
|||
|
Доведіть, що ваша функція задовольняє наступний тестовий приклад:
|
|||
|
|
|||
|
Дано рядок
|
|||
|
|
|||
|
<pre>один^|один||три^^^^|чотири^^^|^чотири|</pre>
|
|||
|
|
|||
|
і використовуючи `|`як розділювач і `^` як escape-символ, ваша функція має вивести наступний масив:
|
|||
|
|
|||
|
<pre> ['один|один', '', 'три^^', 'чотири^|чотири', '']
|
|||
|
</pre>
|
|||
|
|
|||
|
# --hints--
|
|||
|
|
|||
|
`tokenize` має бути функцією.
|
|||
|
|
|||
|
```js
|
|||
|
assert(typeof tokenize === 'function');
|
|||
|
```
|
|||
|
|
|||
|
`tokenize` має повернути масив.
|
|||
|
|
|||
|
```js
|
|||
|
assert(typeof tokenize('a', 'b', 'c') === 'object');
|
|||
|
```
|
|||
|
|
|||
|
`tokenize('one^|uno||three^^^^|four^^^|^cuatro|', '|', '^')` має повернути `['one|uno', '', 'three^^', 'four^|cuatro', '']`
|
|||
|
|
|||
|
```js
|
|||
|
assert.deepEqual(tokenize(testStr1, '|', '^'), res1);
|
|||
|
```
|
|||
|
|
|||
|
`tokenize('a@&bcd&ef&&@@hi', '&', '@')` має повернути `['a&bcd', 'ef', '', '@hi']`
|
|||
|
|
|||
|
```js
|
|||
|
assert.deepEqual(tokenize(testStr2, '&', '@'), res2);
|
|||
|
```
|
|||
|
|
|||
|
# --seed--
|
|||
|
|
|||
|
## --after-user-code--
|
|||
|
|
|||
|
```js
|
|||
|
const testStr1 = 'one^|uno||three^^^^|four^^^|^cuatro|';
|
|||
|
const res1 = ['one|uno', '', 'three^^', 'four^|cuatro', ''];
|
|||
|
|
|||
|
// TODO add more tests
|
|||
|
const testStr2 = 'a@&bcd&ef&&@@hi';
|
|||
|
const res2 = ['a&bcd', 'ef', '', '@hi'];
|
|||
|
```
|
|||
|
|
|||
|
## --seed-contents--
|
|||
|
|
|||
|
```js
|
|||
|
function tokenize(str, sep, esc) {
|
|||
|
return true;
|
|||
|
}
|
|||
|
```
|
|||
|
|
|||
|
# --solutions--
|
|||
|
|
|||
|
```js
|
|||
|
// tokenize :: String -> Character -> Character -> [String]
|
|||
|
function tokenize(str, charDelim, charEsc) {
|
|||
|
const dctParse = str.split('')
|
|||
|
.reduce((a, x) => {
|
|||
|
const blnEsc = a.esc;
|
|||
|
const blnBreak = !blnEsc && x === charDelim;
|
|||
|
const blnEscChar = !blnEsc && x === charEsc;
|
|||
|
|
|||
|
return {
|
|||
|
esc: blnEscChar,
|
|||
|
token: blnBreak ? '' : (
|
|||
|
a.token + (blnEscChar ? '' : x)
|
|||
|
),
|
|||
|
list: a.list.concat(blnBreak ? a.token : [])
|
|||
|
};
|
|||
|
}, {
|
|||
|
esc: false,
|
|||
|
token: '',
|
|||
|
list: []
|
|||
|
});
|
|||
|
|
|||
|
return dctParse.list.concat(
|
|||
|
dctParse.token
|
|||
|
);
|
|||
|
}
|
|||
|
```
|