4.0 KiB
4.0 KiB
title, id, challengeType, forumTopicId, localeTitle
title | id | challengeType | forumTopicId | localeTitle |
---|---|---|---|---|
Tokenize a string with escaping | 594faaab4e2a8626833e9c3d | 5 | 302338 | Токенизировать строку с экранированием |
Description
Напишите функцию или программу, которые могут разбивать строку на каждое неэкранированное вхождение символа разделителя.
Он должен принимать три входных параметра:
Строка Символ разделителя Управляющий символОн должен вывести список строк.
Правила разделения:
Поля, разделенные разделителями, становятся элементами выходного списка. Пустые поля должны быть сохранены, даже в начале и в конце.Правила побега:
«Escaped» означает, что предшествует появление escape-символа, который еще не сбежал. Когда escape-символ предшествует персонажу, который не имеет особого значения, он по-прежнему считается побегом (но не делает ничего особенного). Каждое появление escape-символа, которое использовалось для выхода из него, не должно становиться частью выхода.Продемонстрируйте, что ваша функция удовлетворяет следующему тестовому сценарию: заданная строка
один ^ | у || три ^^^^ | четыре ^^^ | ^ куатро |
и использование |как разделитель и
^как escape-символ, ваша функция должна выводить следующий массив:
['one | uno', ", 'three ^^', 'four ^ | quatro',"]
Instructions
Tests
tests:
- text: <code>tokenize</code> is a function.
testString: assert(typeof tokenize === 'function');
- text: <code>tokenize</code> should return an array.
testString: assert(typeof tokenize('a', 'b', 'c') === 'object');
- text: <code>tokenize('one^|uno||three^^^^|four^^^|^cuatro|', '|', '^') </code> should return <code>['one|uno', '', 'three^^', 'four^|cuatro', '']</code>
testString: assert.deepEqual(tokenize(testStr1, '|', '^'), res1);
- text: <code>tokenize('a@&bcd&ef&&@@hi', '&', '@')</code> should return <code>['a&bcd', 'ef', '', '@hi']</code>
testString: assert.deepEqual(tokenize(testStr2, '&', '@'), res2);
Challenge Seed
function tokenize(str, esc, sep) {
return true;
}
After Tests
const testStr1 = 'one^|uno||three^^^^|four^^^|^cuatro|';
const res1 = ['one|uno', '', 'three^^', 'four^|cuatro', ''];
// TODO add more tests
const testStr2 = 'a@&bcd&ef&&@@hi';
const res2 = ['a&bcd', 'ef', '', '@hi'];
Solution
// tokenize :: String -> Character -> Character -> [String]
function tokenize(str, charDelim, charEsc) {
const dctParse = str.split('')
.reduce((a, x) => {
const blnEsc = a.esc;
const blnBreak = !blnEsc && x === charDelim;
const blnEscChar = !blnEsc && x === charEsc;
return {
esc: blnEscChar,
token: blnBreak ? '' : (
a.token + (blnEscChar ? '' : x)
),
list: a.list.concat(blnBreak ? a.token : [])
};
}, {
esc: false,
token: '',
list: []
});
return dctParse.list.concat(
dctParse.token
);
}