/[LeafOK_CVS]/lbbs/src/str_process.c
ViewVC logotype

Diff of /lbbs/src/str_process.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

Revision 1.23 by sysadm, Tue Nov 4 13:49:51 2025 UTC Revision 1.32 by sysadm, Sat Nov 22 10:36:37 2025 UTC
# Line 3  Line 3 
3   * str_process   * str_process
4   *   - common string processing features with UTF-8 support   *   - common string processing features with UTF-8 support
5   *   *
6   * Copyright (C) 2004-2025 by Leaflet <leaflet@leafok.com>   * Copyright (C) 2004-2025  Leaflet <leaflet@leafok.com>
7   */   */
8    
9    #ifdef HAVE_CONFIG_H
10    #include "config.h"
11    #endif
12    
13  #include "common.h"  #include "common.h"
14  #include "log.h"  #include "log.h"
15  #include "str_process.h"  #include "str_process.h"
16  #include <ctype.h>  #include <ctype.h>
17  #include <stdio.h>  #include <stdio.h>
18    #include <stdlib.h>
19  #include <string.h>  #include <string.h>
20    #include <wchar.h>
21    
22    int UTF8_fixed_width = 1;
23    
24  int str_length(const char *str, int skip_ctrl_seq)  int str_length(const char *str, int skip_ctrl_seq)
25  {  {
26            int str_len;
27            char input_str[5];
28            wchar_t wcs[2];
29            int wc_len;
30          int i;          int i;
31          char c;          char c;
32          int ret = 0;          int ret = 0;
# Line 30  int str_length(const char *str, int skip Line 42  int str_length(const char *str, int skip
42    
43                  if (skip_ctrl_seq && c == '\033' && str[i + 1] == '[') // Skip control sequence                  if (skip_ctrl_seq && c == '\033' && str[i + 1] == '[') // Skip control sequence
44                  {                  {
45                          for (i = i + 2; isdigit(str[i]) || str[i] == ';' || str[i] == '?'; i++)                          for (i = i + 2; isdigit((int)str[i]) || str[i] == ';' || str[i] == '?'; i++)
46                                  ;                                  ;
47    
48                          if (str[i] == 'm') // valid                          if (str[i] == 'm') // valid
49                          {                          {
50                                  // skip                                  // skip
51                          }                          }
52                          else if (isalpha(str[i]))                          else if (isalpha((int)str[i]))
53                          {                          {
54                                  // unsupported ANSI CSI command                                  // unsupported ANSI CSI command
55                          }                          }
# Line 52  int str_length(const char *str, int skip Line 64  int str_length(const char *str, int skip
64                  // Process UTF-8 Chinese characters                  // Process UTF-8 Chinese characters
65                  if (c & 0x80) // head of multi-byte character                  if (c & 0x80) // head of multi-byte character
66                  {                  {
67                          c = (c & 0x70) << 1;                          str_len = 0;
68                            c = (char)(c & 0xf0);
69                          while (c & 0x80)                          while (c & 0x80)
70                          {                          {
71                                  i++;                                  input_str[str_len] = str[i + str_len];
72                                    str_len++;
73                                  c = (c & 0x7f) << 1;                                  c = (c & 0x7f) << 1;
74                          }                          }
75                            input_str[str_len] = '\0';
76    
77                          ret += 2;                          if (mbstowcs(wcs, input_str, 1) == (size_t)-1)
78                            {
79    #ifdef _DEBUG
80                                    log_error("mbstowcs(%s) error\n", input_str);
81    #endif
82                                    wc_len = (UTF8_fixed_width ? 2 : 1); // Fallback
83                            }
84                            else
85                            {
86                                    wc_len = (UTF8_fixed_width ? 2 : wcwidth(wcs[0]));
87                            }
88    
89                            i += (str_len - 1);
90                            ret += wc_len;
91                  }                  }
92                  else                  else
93                  {                  {
# Line 76  int split_line(const char *buffer, int m Line 104  int split_line(const char *buffer, int m
104          *p_eol = 0;          *p_eol = 0;
105          *p_display_len = 0;          *p_display_len = 0;
106          char c;          char c;
107            int str_len;
108            char input_str[5];
109            wchar_t wcs[2];
110            int wc_len;
111    
112          for (i = 0; buffer[i] != '\0'; i++)          for (i = 0; buffer[i] != '\0'; i++)
113          {          {
# Line 98  int split_line(const char *buffer, int m Line 130  int split_line(const char *buffer, int m
130    
131                  if (c & 0x80) // head of multi-byte character                  if (c & 0x80) // head of multi-byte character
132                  {                  {
133                          if (*p_display_len + 2 > max_display_len)                          str_len = 0;
134                            c = (char)(c & 0xf0);
135                            while (c & 0x80)
136                          {                          {
137                                  break;                                  input_str[str_len] = buffer[i + str_len];
138                                    str_len++;
139                                    c = (c & 0x7f) << 1;
140                          }                          }
141                            input_str[str_len] = '\0';
142    
143                          c = (c & 0x70) << 1;                          if (mbstowcs(wcs, input_str, 1) == (size_t)-1)
                         while (c & 0x80)  
144                          {                          {
145                                  i++;  #ifdef _DEBUG
146                                  c = (c & 0x7f) << 1;                                  log_error("mbstowcs(%s) error\n", input_str);
147    #endif
148                                    wc_len = (UTF8_fixed_width ? 2 : 1); // Fallback
149                            }
150                            else
151                            {
152                                    wc_len = (UTF8_fixed_width ? 2 : wcwidth(wcs[0]));
153                            }
154    
155                            if (*p_display_len + wc_len > max_display_len)
156                            {
157                                    break;
158                          }                          }
159    
160                          (*p_display_len) += 2;                          i += (str_len - 1);
161                            (*p_display_len) += wc_len;
162                  }                  }
163                  else                  else
164                  {                  {
# Line 155  long split_data_lines(const char *p_buf, Line 203  long split_data_lines(const char *p_buf,
203                  // Exceed max_line_cnt                  // Exceed max_line_cnt
204                  if (line_cnt + 1 >= line_offsets_count)                  if (line_cnt + 1 >= line_offsets_count)
205                  {                  {
206                          // log_error("Line count %d reaches limit %d\n", line_cnt + 1, line_offsets_count);  #ifdef _DEBUG
207                            log_error("Line count %d reaches limit %d\n", line_cnt + 1, line_offsets_count);
208    #endif
209                          return line_cnt;                          return line_cnt;
210                  }                  }
211    
212                  p_line_offsets[line_cnt + 1] = p_line_offsets[line_cnt] + len;                  p_line_offsets[line_cnt + 1] = p_line_offsets[line_cnt] + len;
213                  line_cnt++;                  line_cnt++;
214                  p_buf += len;                  p_buf += len;
215          } while (p_buf[0] != '\0');          } while (p_buf[0] != '\0' || end_of_line);
216    
217          return line_cnt;          return line_cnt;
218  }  }


Legend:
Removed lines/characters  
Changed lines/characters
  Added lines/characters

webmaster@leafok.com
ViewVC Help
Powered by ViewVC 1.3.0-beta1