2002-04-23 H.J. Lu <hjl@gnu.org>
[deliverable/binutils-gdb.git] / binutils / strings.c
index 02ef67ba37ac890bb5d1cdfdf41a74b4ae461825..3507831617024f1ab9a7e6efba1bd8aaa3e4e06c 100644 (file)
@@ -1,5 +1,6 @@
 /* strings -- print the strings of printable characters in files
-   Copyright (C) 1993, 94 Free Software Foundation, Inc.
+   Copyright 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000, 2001,
+   2002 Free Software Foundation, Inc.
 
    This program is free software; you can redistribute it and/or modify
    it under the terms of the GNU General Public License as published by
@@ -13,7 +14,8 @@
 
    You should have received a copy of the GNU General Public License
    along with this program; if not, write to the Free Software
-   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.  */
+   Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
+   02111-1307, USA.  */
 \f
 /* Usage: strings [options] file...
 
    -o          Like -to.  (Some other implementations have -o like -to,
                others like -td.  We chose one arbitrarily.)
 
+   --encoding={s,b,l,B,L}
+   -e {s,b,l,B,L}
+               Select character encoding: single-byte, bigendian 16-bit,
+               littleendian 16-bit, bigendian 32-bit, littleendian 32-bit
+
    --target=BFDNAME
                Specify a non-default object file format.
 
    Written by Richard Stallman <rms@gnu.ai.mit.edu>
    and David MacKenzie <djm@gnu.ai.mit.edu>.  */
 
+#ifdef HAVE_CONFIG_H
+#include "config.h"
+#endif
+#include "bfd.h"
 #include <stdio.h>
 #include <getopt.h>
-#include <ctype.h>
 #include <errno.h>
-#include "bfd.h"
 #include "bucomm.h"
-
-#ifdef isascii
-#define isgraphic(c) (isascii (c) && isprint (c))
+#include "libiberty.h"
+#include "safe-ctype.h"
+
+/* Some platforms need to put stdin into binary mode, to read
+    binary files.  */
+#ifdef HAVE_SETMODE
+#ifndef O_BINARY
+#ifdef _O_BINARY
+#define O_BINARY _O_BINARY
+#define setmode _setmode
 #else
-#define isgraphic(c) (isprint (c))
+#define O_BINARY 0
+#endif
 #endif
+#if O_BINARY
+#include <io.h>
+#define SET_BINARY(f) do { if (!isatty(f)) setmode(f,O_BINARY); } while (0)
+#endif
+#endif
+
+#define isgraphic(c) (ISPRINT (c) || (c) == '\t')
 
 #ifndef errno
 extern int errno;
 #endif
 
 /* The BFD section flags that identify an initialized data section.  */
-#define DATA_FLAGS (SEC_ALLOC | SEC_LOAD | SEC_DATA | SEC_HAS_CONTENTS)
+#define DATA_FLAGS (SEC_ALLOC | SEC_LOAD | SEC_HAS_CONTENTS)
+
+#ifdef HAVE_FOPEN64
+typedef off64_t file_off;
+#define file_open(s,m) fopen64(s,m)
+#else
+typedef off_t file_off;
+#define file_open(s,m) fopen(s,m)
+#endif
 
 /* Radix for printing addresses (must be 8, 10 or 16).  */
 static int address_radix;
@@ -90,7 +122,9 @@ static boolean got_a_section;
 /* The BFD object file format.  */
 static char *target;
 
-extern char *program_version;
+/* The character encoding format.  */
+static char encoding;
+static int encoding_bytes;
 
 static struct option long_options[] =
 {
@@ -98,20 +132,27 @@ static struct option long_options[] =
   {"print-file-name", no_argument, NULL, 'f'},
   {"bytes", required_argument, NULL, 'n'},
   {"radix", required_argument, NULL, 't'},
+  {"encoding", required_argument, NULL, 'e'},
   {"target", required_argument, NULL, 'T'},
   {"help", no_argument, NULL, 'h'},
   {"version", no_argument, NULL, 'v'},
   {NULL, 0, NULL, 0}
 };
 
+static void strings_a_section PARAMS ((bfd *, asection *, PTR));
+static boolean strings_object_file PARAMS ((const char *));
 static boolean strings_file PARAMS ((char *file));
 static int integer_arg PARAMS ((char *s));
-static void print_strings PARAMS ((char *filename, FILE *stream,
-                                 file_ptr address, int stop_point,
+static void print_strings PARAMS ((const char *filename, FILE *stream,
+                                 file_off address, int stop_point,
                                  int magiccount, char *magic));
 static void usage PARAMS ((FILE *stream, int status));
+static long get_char PARAMS ((FILE *stream, file_off *address,
+                             int *magiccount, char **magic));
 \f
-void
+int main PARAMS ((int, char **));
+
+int
 main (argc, argv)
      int argc;
      char **argv;
@@ -120,14 +161,22 @@ main (argc, argv)
   int exit_status = 0;
   boolean files_given = false;
 
+#if defined (HAVE_SETLOCALE)
+  setlocale (LC_ALL, "");
+#endif
+  bindtextdomain (PACKAGE, LOCALEDIR);
+  textdomain (PACKAGE);
+
   program_name = argv[0];
+  xmalloc_set_program_name (program_name);
   string_min = -1;
   print_addresses = false;
   print_filenames = false;
   datasection_only = true;
   target = NULL;
+  encoding = 's';
 
-  while ((optc = getopt_long (argc, argv, "afn:ot:v0123456789",
+  while ((optc = getopt_long (argc, argv, "afhHn:ot:e:Vv0123456789",
                              long_options, (int *) 0)) != EOF)
     {
       switch (optc)
@@ -140,6 +189,7 @@ main (argc, argv)
          print_filenames = true;
          break;
 
+       case 'H':
        case 'h':
          usage (stdout, 0);
 
@@ -147,9 +197,7 @@ main (argc, argv)
          string_min = integer_arg (optarg);
          if (string_min < 1)
            {
-             fprintf (stderr, "%s: invalid number %s\n",
-                      program_name, optarg);
-             exit (1);
+             fatal (_("invalid number %s"), optarg);
            }
          break;
 
@@ -185,16 +233,23 @@ main (argc, argv)
          target = optarg;
          break;
 
+       case 'e':
+         if (optarg[1] != '\0')
+           usage (stderr, 1);
+         encoding = optarg[0];
+         break;
+
+       case 'V':
        case 'v':
-         printf ("GNU %s version %s\n", program_name, program_version);
-         exit (0);
+         print_version ("strings");
+         break;
 
        case '?':
          usage (stderr, 1);
 
        default:
          if (string_min < 0)
-           string_min = optc;
+           string_min = optc - '0';
          else
            string_min = string_min * 10 + optc - '0';
          break;
@@ -204,23 +259,53 @@ main (argc, argv)
   if (string_min < 0)
     string_min = 4;
 
+  switch (encoding)
+    {
+    case 's':
+      encoding_bytes = 1;
+      break;
+    case 'b':
+    case 'l':
+      encoding_bytes = 2;
+      break;
+    case 'B':
+    case 'L':
+      encoding_bytes = 4;
+      break;
+    default:
+      usage (stderr, 1);
+    }
+
   bfd_init ();
+  set_default_bfd_target ();
 
-  for (; optind < argc; ++optind)
+  if (optind >= argc)
     {
-      if (!strcmp (argv[optind], "-"))
-       datasection_only = false;
-      else
+      datasection_only = false;
+#ifdef SET_BINARY
+      SET_BINARY (fileno (stdin));
+#endif
+      print_strings ("{standard input}", stdin, 0, 0, 0, (char *) NULL);
+      files_given = true;
+    }
+  else
+    {
+      for (; optind < argc; ++optind)
        {
-         files_given = true;
-         exit_status |= (strings_file (argv[optind]) == false);
+         if (strcmp (argv[optind], "-") == 0)
+           datasection_only = false;
+         else
+           {
+             files_given = true;
+             exit_status |= (strings_file (argv[optind]) == false);
+           }
        }
     }
 
   if (files_given == false)
     usage (stderr, 1);
 
-  exit (exit_status);
+  return (exit_status);
 }
 \f
 /* Scan section SECT of the file ABFD, whose printable name is FILE.
@@ -228,11 +313,13 @@ main (argc, argv)
    set `got_a_section' and print the strings in it.  */
 
 static void
-strings_a_section (abfd, sect, file)
+strings_a_section (abfd, sect, filearg)
      bfd *abfd;
      asection *sect;
-     PTR file;
+     PTR filearg;
 {
+  const char *file = (const char *) filearg;
+
   if ((sect->flags & DATA_FLAGS) == DATA_FLAGS)
     {
       bfd_size_type sz = bfd_get_section_size_before_reloc (sect);
@@ -254,7 +341,7 @@ strings_a_section (abfd, sect, file)
 
 static boolean
 strings_object_file (file)
-     char *file;
+     const char *file;
 {
   bfd *abfd = bfd_openr (file, target);
 
@@ -274,7 +361,7 @@ strings_object_file (file)
     }
 
   got_a_section = false;
-  bfd_map_over_sections (abfd, strings_a_section, file);
+  bfd_map_over_sections (abfd, strings_a_section, (PTR) file);
 
   if (!bfd_close (abfd))
     {
@@ -299,7 +386,7 @@ strings_file (file)
     {
       FILE *stream;
 
-      stream = fopen (file, "r");
+      stream = file_open (file, FOPEN_RB);
       if (stream == NULL)
        {
          fprintf (stderr, "%s: ", program_name);
@@ -307,7 +394,7 @@ strings_file (file)
          return false;
        }
 
-      print_strings (file, stream, (file_ptr) 0, 0, 0, (char *) 0);
+      print_strings (file, stream, (file_off) 0, 0, 0, (char *) 0);
 
       if (fclose (stream) == EOF)
        {
@@ -320,6 +407,78 @@ strings_file (file)
   return true;
 }
 \f
+/* Read the next character, return EOF if none available.
+   Assume that STREAM is positioned so that the next byte read
+   is at address ADDRESS in the file.
+
+   If STREAM is NULL, do not read from it.
+   The caller can supply a buffer of characters
+   to be processed before the data in STREAM.
+   MAGIC is the address of the buffer and
+   MAGICCOUNT is how many characters are in it.  */
+
+static long
+get_char (stream, address, magiccount, magic)
+     FILE *stream;
+     file_off *address;
+     int *magiccount;
+     char **magic;
+{
+  int c, i;
+  long r = EOF;
+  unsigned char buf[4];
+
+  for (i = 0; i < encoding_bytes; i++)
+    {
+      if (*magiccount)
+       {
+         (*magiccount)--;
+         c = *(*magic)++;
+       }
+      else
+       {
+         if (stream == NULL)
+           return EOF;
+#ifdef HAVE_GETC_UNLOCKED
+         c = getc_unlocked (stream);
+#else
+         c = getc (stream);
+#endif
+         if (c == EOF)
+           return EOF;
+       }
+
+      (*address)++;
+      buf[i] = c;
+    }
+
+  switch (encoding)
+    {
+    case 's':
+      r = buf[0];
+      break;
+    case 'b':
+      r = (buf[0] << 8) | buf[1];
+      break;
+    case 'l':
+      r = buf[0] | (buf[1] << 8);
+      break;
+    case 'B':
+      r = ((long) buf[0] << 24) | ((long) buf[1] << 16) |
+       ((long) buf[2] << 8) | buf[3];
+      break;
+    case 'L':
+      r = buf[0] | ((long) buf[1] << 8) | ((long) buf[2] << 16) |
+       ((long) buf[3] << 24);
+      break;
+    }
+
+  if (r == EOF)
+    return 0;
+
+  return r;
+}
+\f
 /* Find the strings in file FILENAME, read from STREAM.
    Assume that STREAM is positioned so that the next byte read
    is at address ADDRESS in the file.
@@ -334,119 +493,104 @@ strings_file (file)
 
 static void
 print_strings (filename, stream, address, stop_point, magiccount, magic)
-     char *filename;
+     const char *filename;
      FILE *stream;
-     file_ptr address;
+     file_off address;
      int stop_point;
      int magiccount;
      char *magic;
 {
-  int bufsize = 100;
-  char *buf = (char *) xmalloc (bufsize);
+  char *buf = (char *) xmalloc (sizeof (char) * (string_min + 1));
 
   while (1)
     {
+      file_off start;
       int i;
-      int c;
+      long c;
 
       /* See if the next `string_min' chars are all graphic chars.  */
     tryline:
       if (stop_point && address >= stop_point)
        break;
+      start = address;
       for (i = 0; i < string_min; i++)
        {
-         if (magiccount)
-           {
-             magiccount--;
-             c = *magic++;
-           }
-         else
-           {
-             if (stream == NULL)
-               return;
-             c = getc (stream);
-             if (c < 0)
-               return;
-           }
-         address++;
-         if (!isgraphic (c))
+         c = get_char (stream, &address, &magiccount, &magic);
+         if (c == EOF)
+           return;
+         if (c > 255 || c < 0 || !isgraphic (c))
            /* Found a non-graphic.  Try again starting with next char.  */
            goto tryline;
          buf[i] = c;
        }
 
-      /* We found a run of `string_min' graphic characters.
-        Now see if it is terminated with a NUL byte or a newline.   */
-      while (1)
-       {
-         if (i == bufsize)
-           {
-             bufsize *= 2;
-             buf = (char *) xrealloc (buf, bufsize);
-           }
-         if (magiccount)
-           {
-             magiccount--;
-             c = *magic++;
-           }
-         else
-           {
-             if (stream == NULL)
-               return;
-             c = getc (stream);
-             if (c < 0)
-               return;
-           }
-         address++;
-         if (c == '\0' || c == '\n')
-           break;              /* It is; print this string.  */
-         if (!isgraphic (c))
-           goto tryline;       /* It isn't; give up on this string.  */
-         buf[i++] = c;         /* The string continues; store it all.  */
-       }
+      /* We found a run of `string_min' graphic characters.  Print up
+         to the next non-graphic character.  */
 
-      /* If we get here, the string is all graphics and properly terminated,
-        so print it.  It is all in `buf' and `i' is its length.  */
-      buf[i] = '\0';
       if (print_filenames)
        printf ("%s: ", filename);
       if (print_addresses)
        switch (address_radix)
          {
          case 8:
-           printf ("%7lo ", (unsigned long) (address - i - 1));
+#if __STDC_VERSION__ >= 199901L || (defined(__GNUC__) && __GNUC__ >= 2)
+           if (sizeof (start) > sizeof (long))
+             printf ("%7Lo ", (unsigned long long) start);
+           else
+#else
+# if !BFD_HOST_64BIT_LONG
+           if (start != (unsigned long) start)
+             printf ("++%7lo ", (unsigned long) start);
+           else
+# endif
+#endif
+             printf ("%7lo ", (unsigned long) start);
            break;
 
          case 10:
-           printf ("%7ld ", (long) (address - i - 1));
+#if __STDC_VERSION__ >= 199901L || (defined(__GNUC__) && __GNUC__ >= 2)
+           if (sizeof (start) > sizeof (long))
+             printf ("%7Ld ", (unsigned long long) start);
+           else
+#else
+# if !BFD_HOST_64BIT_LONG
+           if (start != (unsigned long) start)
+             printf ("++%7ld ", (unsigned long) start);
+           else
+# endif
+#endif
+             printf ("%7ld ", (long) start);
            break;
 
          case 16:
-           printf ("%7lx ", (unsigned long) (address - i - 1));
+#if __STDC_VERSION__ >= 199901L || (defined(__GNUC__) && __GNUC__ >= 2)
+           if (sizeof (start) > sizeof (long))
+             printf ("%7Lx ", (unsigned long long) start);
+           else
+#else
+# if !BFD_HOST_64BIT_LONG
+           if (start != (unsigned long) start)
+             printf ("%lx%8.8lx ", start >> 32, start & 0xffffffff);
+           else
+# endif
+#endif
+             printf ("%7lx ", (unsigned long) start);
            break;
          }
 
-      for (i = 0; (c = buf[i]) != '\0'; i++)
-       switch (c)
-         {
-         case '\n':
-           printf ("\\n");
-           break;
-         case '\t':
-           printf ("\\t");
-           break;
-         case '\f':
-           printf ("\\f");
-           break;
-         case '\b':
-           printf ("\\b");
+      buf[i] = '\0';
+      fputs (buf, stdout);
+
+      while (1)
+       {
+         c = get_char (stream, &address, &magiccount, &magic);
+         if (c == EOF)
            break;
-         case '\r':
-           printf ("\\r");
+         if (c > 255 || c < 0 || !isgraphic (c))
            break;
-         default:
-           putchar (c);
-         }
+         putchar (c);
+       }
+
       putchar ('\n');
     }
 }
@@ -493,8 +637,7 @@ integer_arg (s)
 
   if (*p)
     {
-      fprintf (stderr, "%s: invalid integer argument %s\n", program_name, s);
-      exit (1);
+      fatal (_("invalid integer argument %s"), s);
     }
   return value;
 }
@@ -504,10 +647,22 @@ usage (stream, status)
      FILE *stream;
      int status;
 {
-  fprintf (stream, "\
-Usage: %s [-afov] [-n min-len] [-min-len] [-t {o,x,d}] [-]\n\
-       [--all] [--print-file-name] [--bytes=min-len] [--radix={o,x,d}]\n\
-       [--target=bfdname] [--help] [--version] file...\n",
-          program_name);
+  fprintf (stream, _("Usage: %s [option(s)] [file(s)]\n"), program_name);
+  fprintf (stream, _(" Display printable strings in [file(s)] (stdin by default)\n"));
+  fprintf (stream, _(" The options are:\n\
+  -a - --all                Scan the entire file, not just the data section\n\
+  -f --print-file-name      Print the name of the file before each string\n\
+  -n --bytes=[number]       Locate & print any NUL-terminated sequence of at\n\
+  -<number>                 least [number] characters (default 4).\n\
+  -t --radix={o,x,d}        Print the location of the string in base 8, 10 or 16\n\
+  -o                        An alias for --radix=o\n\
+  -T --target=<BFDNAME>     Specify the binary file format\n\
+  -e --encoding={s,b,l,B,L} Select character size and endianness:\n\
+                            s = 8-bit, {b,l} = 16-bit, {B,L} = 32-bit\n\
+  -h --help                 Display this information\n\
+  -v --version              Print the program's version number\n"));
+  list_supported_targets (program_name, stream);
+  if (status == 0)
+    fprintf (stream, _("Report bugs to %s\n"), REPORT_BUGS_TO);
   exit (status);
 }
This page took 0.029741 seconds and 4 git commands to generate.